VSM中词权重的信息熵算法  被引量:8

A Shannon Entropy Approach to Term Weighting in VSM

在线阅读下载全文

作  者:刁倩[1] 王永成[1] 张惠惠[1] 何骥[1] 

机构地区:[1]上海交通大学,上海200030

出  处:《情报学报》2000年第4期354-358,共5页Journal of the China Society for Scientific and Technical Information

摘  要:本文提出一种基于Shannon信息熵的向量空间模型 (VSM )中的词权重算法。同时结合词与文献的相关权重的经典计算方法IDF(InverseDocumentFrequency) ,进一步总结了向量空间模型 (VSM)中两种词权重计算的具体公式。In this paper,a Shannon entropy approach to term weighting in VSM(Vector Space Model)is provided.Furthermore,combined with IDF(Inverse Document Frequency),we summarized two term weighting equation in VSM.

关 键 词:向量空间模型 自动分类 信息熵 VSM 词权重 

分 类 号:G354.2[文化科学—情报学]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象