基于数据融合的组合特征提取方法的研究  被引量:1

Research on combination feature selection method based on data fusion

在线阅读下载全文

作  者:谈佳宁[1] 朱玉全[1] 陈耿[1] 翟国[1] 

机构地区:[1]江苏大学计算机科学与通信工程学院,江苏镇江212013

出  处:《计算机工程与设计》2009年第10期2529-2532,共4页Computer Engineering and Design

摘  要:针对Web文本的特征提取方法多种多样,但均存在各自的不足且对数据集偏斜问题普遍没有很好的解决能力,针对该问题采用BNS特征提取算法和Odds特征提取算法基于数据融合思想进行Web文本特征提取并用支持向量机进行分类。在保持BNS算法对于数据集偏斜问题的解决能力的基础上用Odds算法提高BNS算法的精确度。实验结果表明,用数据融合思想将这两种方法结合可以有效弥补两种方法各自的不足,并能提高分类准确率。There are a lot of methods to select features of Web text, but they all have their own disadvantages, to solve this problem, the features of web text are selected by BNS metrics and Odds metrics based on data fusion and are classified by support vector machines. We can let Odds metrics improve the precision of BNS metrics based on keeping BNS metrics's capability of resolving class skew. The experimental results indicate that combining these based on data fusion can greatly improve disadvantages of each method and improve the precision of text classify.

关 键 词:特征提取 数据集偏斜 数据融合 支持向量机 WEB文本分类 

分 类 号:TP391.4[自动化与计算机技术—计算机应用技术]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象