自动文本分类

作品数:32被引量:621H指数:8
导出分析报告
相关领域:自动化与计算机技术更多>>
相关作者:任美睿宋枫溪张全赵晖荣莉莉更多>>
相关机构:中国科学院清华大学中国科学院研究生院黑龙江大学更多>>
相关期刊:《计算机应用与软件》《小型微型计算机系统》《北京邮电大学学报》《软件学报》更多>>
相关基金:国家自然科学基金国家重点基础研究发展计划国家教育部博士点基金广东省哲学社会科学“十一五”规划项目更多>>
-

检索结果分析

结果分析中...
条 记 录,以下是1-10
视图:
排序:
基于自动文本分类的中医症状标准化路径探讨被引量:3
《中华中医药杂志》2022年第10期5671-5675,共5页赵宗耀 陈剑北 柳辰玥 薛哲 刘骐瑞 陈家旭 
基于“六异识候”症状标准化理论体系,明确了中医症状标准化的3个阶段任务和基于人工智能的技术路径。第1阶段任务是明确症状类型;第2阶段任务是明确不同症状类型描述公式中的具体内容;第3阶段任务是构建标准化症状数据库以及各类标准...
关键词:六异识候 症状 标准化 文本分类 
基于KNN+层次SVM的文本自动分类技术被引量:7
《计算机应用与软件》2016年第2期38-41,共4页王金华 喻辉 产文 周向东 施伯乐 
针对大规模文本的自动层次分类问题,K近邻(KNN)算法分类效率较高,但是对于处于类别边界的样本分类准确度不是很高。而支持向量机(SVM)分类算法准确度比较高,但以前的多类SVM算法很多基于多个独立二值分类器组成,训练过程比较缓慢并且不...
关键词:自动文本分类 KNN 层次SVM 
竞争情报系统中一种自动文本分类策略——以民用航空客服行业为例被引量:2
《图书情报工作》2012年第24期39-43,119,共6页秦宝宝 宋继伟 董尹 牛青 吕美香 陈彬 李骁 
将自动文本分类引入竞争情报系统,并结合民航客服业的实际应用场景展开研究。在对文本分类的理论基础进行研究与分析的基础上,设计一种自动分类策略,其核心是针对传统机器学习方法依赖历史数据的局限,优化特征选择和学习样本获取方法。...
关键词:自动文本分类 竞争情报系统 民用航空客户服务 支持向量机 
结合语言模型的自动文本分类的应用研究
《计算机与现代化》2010年第3期141-143,共3页赵敏涯 
研究统计语言模型中bigram模型在自动文本分类中的应用,针对传统的向量空间模型在计算文本相似度时假设特征项相互独立的缺点,提出一种利用词对及词序信息来改善文本分类结果的方法。实验结果表明该方法是可行且有效的。
关键词:统计语言模型 文本分类 平滑 bigram 
自动文本分类中朴素贝叶斯算法的改进
《硅谷》2010年第1期92-92,共1页陶伟 
朴素贝叶斯分类算法是贝叶斯方法中最简单的一个方法,它具有很强的条件独立性,构造过程简单,不需要结构的搜索过程。修改过的分类算法比原朴素贝叶斯分类算法在对大多数文本进行分类时体现出更高的准确率。
关键词:朴素贝叶斯算法 自动文本分类 文本挖掘 
基于自动文本分类的关键词抽取算法被引量:18
《计算机工程》2009年第12期145-147,共3页张虹 
分析现有几种中文分词方法,提出一种关键词抽取算法。以词语的权重公式为中心,利用遗传算法训练、优化公式中的参数,得到一组适合中文文本的参数,提高文章子主题划分的精度。实验分析表明,该算法能将抽取系统中的命名实体有效地切分出来...
关键词:文本分类 分词技术 关键词抽取 遗传算法 
基于关系权重的文本表示法
《计算机应用与软件》2009年第5期68-69,80,共3页倪洁琼 吴耿锋 郑宇 
国家特种信息产品动员中心项目(SNMCFIP-2006S001)
提出一种基于关系权重的文本表示方法。通过优化关系权重,在文本向量中体现了不同特征项在不同类别中重要程度的差异,使得在此权重下不同类别的文本得到更准确的区分。运用SVM分类实验表明,基于关系权重的文本表示方法,较之传统的TF-ID...
关键词:自动文本分类 文本表示 关系权重 
基于文章标题信息的汉语自动文本分类被引量:2
《计算机工程》2008年第20期13-14,17,共3页缪建明 张全 赵金仿 
国家“973”计划基金资助项目“自然语言理解的交互引擎研究”(2004CB318104);中科院声学所知识创新工程基金资助项目“HNC语言知识处理理论及技术”
文本分类是文本挖掘的一个重要组成部分,是信息搜索领域的一项重要研究课题。该文提出一种基于文章标题信息的汉语自动文本分类方法,在HNC理论的领域概念框架下,通过标题信息所蕴涵的领域信息词语激活对应的HNC领域,实现文本的自动分类...
关键词:文本分类 HNC理论 领域 
网页信息抽取及其自动文本分类的实现被引量:7
《计算机技术与发展》2008年第10期37-39,共3页赵金仿 赵艳 缪建明 
国家自然科学基金(60573064)
Web页面中常包含非主题信息的内容,网页必须剔除这些无用的信息后才能形成有用的文本信息。文本分类对文本信息的进一步加工处理至关重要,是信息搜索领域的另一研究课题。为了剔除网页中的无用信息,提出一种基于HTML自身结构特点的网页...
关键词:标记 文本分类 信息抽取 
研究中文文本分类技术的辅助平台被引量:2
《清华大学学报(自然科学版)》2008年第7期1150-1153,共4页白若鹞 董渊 张素琴 徐大伟 
国家自然科学基金资助项目(60573017);国家海洋局数字海洋项目(908-03-01-13)
为方便中文文本分类过程算法研究,阐述中文文本分类的基础技术,提出基于构件的中文文本分类技术研究辅助平台。该平台对大多数分类中使用的算法在中文文本分类中的应用效果进行了研究。实验结果表明:该平台可以通过计算分类器分类准确...
关键词:自动文本分类 中文分词 特征选择 分类算法 
检索报告 对象比较 聚类工具 使用帮助 返回顶部