一种基于质心与本体的文本分类方法  被引量:3

A Classification Method Based on Centroid and Ontology

在线阅读下载全文

作  者:王辉[1] 左万利[1] 袁华[1] 

机构地区:[1]吉林大学计算机科学与技术学院,长春,130012 吉林大学计算机科学与技术学院,长春,130012 吉林大学计算机科学与技术学院,长春,130012

出  处:《计算机研究与发展》2007年第z2期6-11,共6页Journal of Computer Research and Development

基  金:国家自然科学基金项目(60373099);教育部"符号计算与知识工程"重点实验室基金项目(93K-17)

摘  要:针对传统的TFIDF模型计算根集(root set)文档特征权重的不适应性,提出了计算文档特征权重的新方法--TFIDF-2模型.另外,给出3种启发式规则用于获取根集文档的质心向量.通过计算文档与质心之间的相似度进行文本分类只是质心的一个初步应用.在这个过程中,提出了一种计算文档与质心之间相似度的新方法.通过一系列的对比实验,分析验证了此种分类方法比传统的分类算法更准确、更高效.最后,验证了将本体与质心相结合提取未标识数据集中相关文档的有效性.

关 键 词:质心 文本分类 TFIDF 主题爬行 本体 

分 类 号:TP181[自动化与计算机技术—控制理论与控制工程]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象