基于改进的TF-IDF特征权重算法的网页自动分类  被引量:2

Auto-Classification of Web Page Based on the Improved TF-IDF Weighting Algorithm

在线阅读下载全文

作  者:蔡银珊[1] 黄英铭[1] 

机构地区:[1]揭阳职业技术学院数学与计算机科学系,广东揭阳522000

出  处:《绵阳师范学院学报》2010年第8期106-109,共4页Journal of Mianyang Teachers' College

摘  要:TF-IDF是文档特征权重表示常用方法,但不能真正地反映特征词对区分每个类的贡献。故针对网页分类中特征选择方法存在的问题,加入网页标签特征权重改进TF-IDF公式,提出了一种比较有效的网页分类算法,实验结果表明该方法具有较好的特征选择效果,能够有效地提高分类精度。TF - IDF weighting is the document showing common method, which can not truly reflect the characteristics of words to distinguish the contribution of each class. To solve the existed problems, this feature selection for web page classification join the Web tab features to improve TF - IDF weighting formula, which is a more effective web page classification algorithm. Experiment results show that the method has a good effect of feature selection and can effectively improve the classification accuracy.

关 键 词:网页分类 TF-IDF 特征权重 

分 类 号:TP301[自动化与计算机技术—计算机系统结构]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象