文本索引词项相对权重计算方法与应用  被引量:9

A Relative Text Item Frequency Weighting Method and its Application

在线阅读下载全文

作  者:蓝海洋[1] 周杰韩[1] 张和明[1] 

机构地区:[1]清华大学自动化系,北京100084

出  处:《计算机工程与应用》2003年第15期68-70,共3页Computer Engineering and Applications

基  金:国家自然科学基金项目"虚拟样机环境下复杂产品多领域协同建模方法研究"(课题编号:NSFC60274044)

摘  要:文本索引词权重计算方法决定了文本分类的准确率。该文提出一种文本索引词项相对权重计算方法,即文本索引词项权重根据索引词项在该文本中的出现频率与在整个文本空间出现的平均频率之间的相对值进行计算。该方法能有效地提高索引词对文本内容识别的准确性。The text classification accuracy depends on item frequency weighting.This paper proposes a relative text item frequency weighting Method.Namely,the weight of a term in a document is given by the difference of the term frequency in the document relative to the average frequency of the term over the documents.The new approach can effectively increase the accuracy of the terms identifying the document.

关 键 词:知识管理 文本分类 索引词权重 

分 类 号:TP301.6[自动化与计算机技术—计算机系统结构]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象