SVM网页分类中一种新的特征提取方法  被引量:1

A New Feature Selection Method in SVM Web Page Classification

在线阅读下载全文

作  者:孙明柱[1] 魏海平[1] 顿绍坤[1] 王居柱[1] 

机构地区:[1]辽宁石油化工大学计算机与通信工程学院,抚顺113001

出  处:《科学技术与工程》2011年第6期1359-1362,共4页Science Technology and Engineering

摘  要:随着互联网的迅速发展,对网页正确分类显得越来越重要。网页分类的一个难点就是特征空间的维数比较大,支持向量机(SVM)分类方法显示出比其它分类方法更好的性能,但是训练样本时却花费了比其它算法更多的时间。提出了一种基于选择最确信的词来预测一个文本的类别的特征提取方法,通过中文文本实验,结果表明在不降低分类准确性的前提下,缩短了训练时间。With the rapid development of Internet,the need of correctly Web page classification is becoming more and more critical.The major problem in Web page classification is the high dimensionality of feature space.The Support Vector Machine classifier is shown to perform better than other Web page classification algorithms.However,the time taken for training a Support Vector Machine model is more than other algorithms.A feature selection method based on the most certainly keyword to predict the category of a Web page was proposed.Through the experimental of Chinese text,the results show that this method reduces the training time,while maintaining the accuracy of Web page classification.

关 键 词:特征提取 WEB分类 支持向量机 

分 类 号:TP311.11[自动化与计算机技术—计算机软件与理论]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象