基于潜在语义分析的网页文本分类研究  被引量:2

Web Text Categorization Based on Latent Semantic Analysis

在线阅读下载全文

作  者:王剑锋[1] 乔冬[1] 麻丽娜[1] 李新叶[1] 

机构地区:[1]华北电力大学科技学院信息工程系,河北保定071051

出  处:《应用能源技术》2009年第11期41-44,共4页Applied Energy Technology

基  金:华北电力大学青年教师科研基金项目(200811036)

摘  要:传统的基于词空间的文本分类方法很难处理文本的高维特性,提出基于潜在语义空间的网页文本分类方法,将文本数据由高维空间映射到低维空间,通过奇异值分解提取文本的潜在语义空间。在潜在语义空间中利用支持向量机方法实现文本分类;实验表明该方法对于改进文本分类的性能具有较好的效果。Traditional text categorization methods are difficult to deal with the high dimensionality characteristic of the text document based on semantic concept of the words. This paper proposed a method to Web text categorization based on latent semantic analysis. Textual data was mapped into a lower space. The proposed approach used the singular - value decomposition to derive a latent semantic space. The SVM is used to text categorization in the semantic space. Experimental results show that the method is effective on the performance of the text categorization.

关 键 词:潜在语义分析 网页文本分类 支持向量机 

分 类 号:TP334.2[自动化与计算机技术—计算机系统结构]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象