自动文本分类中两种文本表示方式的比较  被引量:6

Comparison of Two Text Representation Methods

在线阅读下载全文

作  者:宋枫溪[1,2] 郑如冰[1] 王积忠[1] 

机构地区:[1]炮兵学院一系 [2]南京理工大学计算机系,南京210094

出  处:《计算机工程》2004年第18期124-126,共3页Computer Engineering

摘  要:以路透社财经新闻语料库为实验数据集,比较了主流文本表示方式BOW和独立于语言的字符串表示方式n-Gram,在k近邻和支持向量机分类器下的分类效果,得出了上述两种不同文本表示方式的分类结果之间不存在显著差异的结论。To compare the impact of two different text representation methods on the performance of support vector machines and k-nearest neighbor classifiers extensive experimental, studies are conducted on Reuters-21578 datasets. Statistical analysis of these experimental results shows that there is no significant difference between the two text representation methods.

关 键 词:文本分类 文本表示 支持向量机 K近邻 秩和检验 

分 类 号:TP181[自动化与计算机技术—控制理论与控制工程]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象