中文文本自动分类

作品数:18被引量:103H指数:7
导出分析报告
相关领域:自动化与计算机技术更多>>
相关作者:薛德军都云琪马金娜田大钢康岚兰更多>>
相关机构:清华大学江西理工大学上海交通大学西安电子科技大学更多>>
相关期刊:《硅谷》《教育技术导刊》《计算机应用研究》《小型微型计算机系统》更多>>
相关基金:国家重点基础研究发展计划国家科技部专项基金国家教育部博士点基金上海市教育委员会重点学科基金更多>>
-

检索结果分析

结果分析中...
条 记 录,以下是1-10
视图:
排序:
基于机器学习的中文文本自动分类的实践研究
《智库时代》2019年第45期233-234,共2页韦灵 黎伟强 
2018年度广西高校中青年教师基础能力提升项目——基于机器学习的文本分类算法研究与应用(2018KY0879)
信息技术应用平台的拓展、互联网用户数量的大幅度增加,使得网络平台成为人们生活、工作的重要阵地,随之而来的,网络数据计算、分类需要以秒级为单位处理,技术难度更大。为深入、全面的开发数据资源的内在价值,进一步提升文本分类的实...
关键词:文本表示 数据集偏斜 多层分类 
基于机器学习的中文文本自动分类的实践研究被引量:1
《智库时代》2019年第46期265-266,共2页韦灵 黎伟强 
2018年度广西高校中青年教师基础能力提升项目——基于机器学习的文本分类算法研究与应用(2018KY0879)
信息技术应用平台的拓展、互联网用户数量的大幅度增加,使得网络平台成为人们生活、工作的重要阵地,随之而来的,网络数据计算、分类需要以秒级为单位处理,技术难度更大。为深入、全面地开发数据资源的内在价值,进一步提升文本分类的实...
关键词:文本表示 数据集偏斜 多层分类 
基于SUMO本体的中文文本自动分类研究被引量:3
《情报科学》2015年第6期43-47,共5页马芳 
在文本分类中,传统的文本表示模型忽略了词语之间的内在关联性,而真实的文本中存在较复杂的语义关系。针对此问题,将SUMO本体引入文本分类模型,利用本体的概念语义关系和清晰的层次结构,对文本内容进行概念映射,使最终特征空间包含更多...
关键词:文本分类 本体 向量空间 
中文文本自动分类中的特征选择改进与研究
《工业控制计算机》2012年第11期89-90,92,共3页张振浩 周奇年 杨继慧 徐登彩 
特征选择是中文文本分类过程中的一个关键环节,文本特征项选择的优劣将直接影响文本分类的准确率。针对传统的特征选择算法没有考虑到特征项的类别区分度在特征选择中的作用而丧失了一些优秀的特征项的问题,文中通过引入特征项的类别区...
关键词:中文文本自动分类 特征选择 类别区分度 互信息 期望交叉熵 
基于KNN和SVM的中文文本自动分类研究被引量:10
《情报科学》2011年第9期1313-1317,1377,共6页张野 杨建林 
国家社会科学基金项目(09BTQ020)
借助文本分类系统软件,采用来自10个大类的中文文本数据,按照训练集与测试集2:1的比例,使用KNN和SVM分类算法,对数据集进行自动分类的实验。旨在通过具体的语料库实验,探讨文本自动分类的关键技术,分析、比较与评价实验结果,探讨文本分...
关键词:自动分类 KNN SVM 中文信息处理 
一种改进的互信息特征选择方法被引量:2
《电脑知识与技术》2009年第12Z期9889-9890,共2页康岚兰 董丹丹 
特征选择是中文文本自动分类领域中极其重要的研究内容,其目的是为了解决特征空间高维性和文档表示向量稀疏性之间的矛盾。针对互信息(MI)特征选择方法分类效果较差的现状,提出了一种改进的互信息特征选择方法IMI。该方法考虑了特征项...
关键词:中文文本自动分类 特征选择 互信息 
中文文本自动分类中特征词选择算法研究被引量:1
《硅谷》2009年第20期65-,共1页于瑞萍 张明 
影响中文文本自动分类的因素较多,算法也较多,每个处理步骤使用的算法之间互相影响,找到合适的算法组合,是提高其性能的一个重要方法,主要工作是实现了一个中文文本自动分类系统,并且通过测试,使得特征词选择算法和分类算法之间的较佳...
关键词:中文文本自动分类 智能信息处理 特征词选择 
常用特征选择方法的比较研究被引量:1
《电脑知识与技术》2009年第12期9787-9789,共3页康岚兰 董丹丹 
特征选择是中文文本自动分类领域中极其重要的研究内容,其目的是为了解决特征空间高维性和文档表示向量稀疏性之间的矛盾。常用的特征选择方法有:文档频数、信息增益、互信息、期望交叉熵、卡方统计量和文本证据权等。在该本自动分类...
关键词:中文文本自动分类 特征选择 特征评估函数 性能 
基于KNN的中文文本自动分类研究
《教育技术导刊》2008年第2期16-18,共3页花洁 刘涛 
在介绍SVM和KNN分类算法的基础上,提出了一种新的、较简单的,但更为合理的基于表模型的文档表示方法,阐述了一种基于表模型的分类算法——TableKNN算法。通过实验比较TableKNN算法与传统KNN算法应用于文本分类的效果,证实了TableKNN算...
关键词:KNN VSM TableKNN 文本自动分类 
基于支持向量机的中文文本自动分类研究被引量:14
《系统工程与电子技术》2007年第3期475-478,共4页马金娜 田大钢 
上海市重点学科基金(T0502);上海市教育委员会发展基金(05E233)资助课题
提出了一种基于支持向量机的文本自动分类方法,并进行了实验研究。在详细介绍了进行文本分类的实验过程和在实验中使用支持向量机的方法的基础上,通过实验比较了支持向量机算法和传统的KNN算法应用于文本分类的效果,并针对支持向量机算...
关键词:文本分类 支持向量机 特征提取 
检索报告 对象比较 聚类工具 使用帮助 返回顶部