检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
机构地区:[1]中国科学院声学研究所,北京100080 [2]江苏科技大学电子信息学院,镇江212003
出 处:《计算机工程》2008年第20期13-14,17,共3页Computer Engineering
基 金:国家“973”计划基金资助项目“自然语言理解的交互引擎研究”(2004CB318104);中科院声学所知识创新工程基金资助项目“HNC语言知识处理理论及技术”
摘 要:文本分类是文本挖掘的一个重要组成部分,是信息搜索领域的一项重要研究课题。该文提出一种基于文章标题信息的汉语自动文本分类方法,在HNC理论的领域概念框架下,通过标题信息所蕴涵的领域信息词语激活对应的HNC领域,实现文本的自动分类。实验证明,该方法与采用SVM算法进行文本分类的方法比较,测试速度和分类平均准确率明显提高。The text categorization is an important part of the text excavation, and it becomes the research topic in the information searching field. The paper proposes a method of the automatic text categorization which uses the article title information. The method based on the domain concept frame of the Hierarchical Network of Concepts(HNC) theory uses the domain concept of the tide information to activate the corresponding HNC domain, and realizes the text automatic categorization. The experiment proves that the method may effectively enhance the efficiency and the accurate rate of the text automatic categorization.
分 类 号:TP393.09[自动化与计算机技术—计算机应用技术]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:3.148.182.104