文本自动分类中的词权重与分类算法  被引量:27

Term Weighting and Classification Algorithms

在线阅读下载全文

作  者:刁倩[1] 王永成[1] 张惠惠[2] 何骥[1] 

机构地区:[1]上海交通大学电脑应用技术研究所,上海200030 [2]上海交通大学图书馆,上海200030

出  处:《中文信息学报》2000年第3期25-29,共5页Journal of Chinese Information Processing

摘  要:本文详细阐述了自动分类中的词与文献的相关权重的经典计算方法IDF(InverseDocumentFrequency) ,进一步总结了两种典型的分类算法———Bayes判别准则与向量空间模型 (VSM) ,并提出结合词权重和分类算法进行分类的具体公式以及相关实验结果。In this paper,a classical term weighting method——IDF(Inverse Document Frequency) is discussed detailedly.The two important classification algorithms——Bayes Judge Rule and VSM (Vector Space Model) are summarized.Furthermore,the way of how to combine term weighting methods with two classification algorithm is also provided in the paper.

关 键 词:自动分类 IDF 文本 词权重 分类算法 信息检索 

分 类 号:TP391[自动化与计算机技术—计算机应用技术] G254-39[自动化与计算机技术—计算机科学与技术]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象