基于关系权重的文本表示法  

A RELATION-WEIGHT BASED DOCUMENT REPRESENTATION

在线阅读下载全文

作  者:倪洁琼[1] 吴耿锋[1] 郑宇[1] 

机构地区:[1]上海大学计算机工程与科学学院,上海200072

出  处:《计算机应用与软件》2009年第5期68-69,80,共3页Computer Applications and Software

基  金:国家特种信息产品动员中心项目(SNMCFIP-2006S001)

摘  要:提出一种基于关系权重的文本表示方法。通过优化关系权重,在文本向量中体现了不同特征项在不同类别中重要程度的差异,使得在此权重下不同类别的文本得到更准确的区分。运用SVM分类实验表明,基于关系权重的文本表示方法,较之传统的TF-IDF文本表示法,有更高的准确率和召回率。We present a method of relation-weight based document representation. The method takes into account the text vectors that dif- ferent feature items in different classes have different weightiness, so that the documents in different classes are classified better by optimizing the relation-weight. The experiments based on SVM classification show that our method has higher precision rate and recall rate in automatic text classification comparing with the method of TF-IDF document representation.

关 键 词:自动文本分类 文本表示 关系权重 

分 类 号:TP391[自动化与计算机技术—计算机应用技术] TH126[自动化与计算机技术—计算机科学与技术]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象