融合LSI和支持向量聚类的网页文本分类算法  被引量:1

Web text classification algorithm fused LSI and SVC

在线阅读下载全文

作  者:史长琼[1,2] 黄辉[1] 王大卫[1] 姜腊林[1] 扶宗文[1] 

机构地区:[1]长沙理工大学计算机与通信工程学院,长沙410076 [2]湖南大学计算机与通信学院,长沙410082

出  处:《计算机应用研究》2009年第12期4523-4525,共3页Application Research of Computers

基  金:湖南省教育厅自然科学基金资助项目(06C111)

摘  要:特征选择和分类算法是网页文本聚类中最关键的技术。提出对网页文本提取特征值后,利用潜在语义索引对网页文本降维,采用支持向量聚类(SVC)算法对降维后的特征向量进行聚类,以此进行文本分类。实验结果显示具有较好的效果。Feature extraction and clustering algorithm are the most crucial technologies for Web text clustering.This paper proposed that latent semantic indexing(LSI) was used for Web text dimension reduction and feature extraction,and then the processed results was clustered by support vector clustering(SVC).The experiment indicates that the method can get good results.

关 键 词:特征提取 潜在语义索引 网页文本 语义聚类 支持向量聚类 

分 类 号:TP18[自动化与计算机技术—控制理论与控制工程] TP301.6[自动化与计算机技术—控制科学与工程]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象