基于特征噪声加权的特征权重算法改进  

Feature weight algorithm based on feature noise weighting

在线阅读下载全文

作  者:赵航[1] 杨天奇[1] 赵小厦[2] 

机构地区:[1]暨南大学信息科学技术学院,广东广州510632 [2]华南师范大学计算机学院,广东广州510631

出  处:《微型机与应用》2012年第3期66-68,共3页Microcomputer & Its Applications

基  金:澳门科学技术发展基金(046/2010/A)

摘  要:特征权重算法TF-IDF是文本分类的重要算法之一,该算法IDF值容易受特征噪声影响出现波动。提出一种基于特征噪声加权的特征权重改进算法,该算法通过分析噪声特征的分布特点,对不能准确表达文档真实意思的特征噪声进行加权,降低特征噪声对IDF的影响,最终有效地提高算法的精度和健壮性。The algorithm of term weighting TF-IDF is one of the most important algorithm, but it fluctuates greatly when affected by the term noises. The paper proposes a feature weight algorithm basing on feature noise weighting. This algorithm analyses the distribution features of the term noises and weights the term noise which can't express the true meaning of the author in the document. Thereby the influence on the IDF is reduced, which is caused by the term noise. Finally the precision and the robustness are improved obviously.

关 键 词:向量空间模型 文本分类 特征噪声 特征权重 健壮性 

分 类 号:TP391[自动化与计算机技术—计算机应用技术]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象