检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
作 者:王剑锋[1] 乔冬[1] 麻丽娜[1] 李新叶[1]
机构地区:[1]华北电力大学科技学院信息工程系,河北保定071051
出 处:《应用能源技术》2009年第11期41-44,共4页Applied Energy Technology
基 金:华北电力大学青年教师科研基金项目(200811036)
摘 要:传统的基于词空间的文本分类方法很难处理文本的高维特性,提出基于潜在语义空间的网页文本分类方法,将文本数据由高维空间映射到低维空间,通过奇异值分解提取文本的潜在语义空间。在潜在语义空间中利用支持向量机方法实现文本分类;实验表明该方法对于改进文本分类的性能具有较好的效果。Traditional text categorization methods are difficult to deal with the high dimensionality characteristic of the text document based on semantic concept of the words. This paper proposed a method to Web text categorization based on latent semantic analysis. Textual data was mapped into a lower space. The proposed approach used the singular - value decomposition to derive a latent semantic space. The SVM is used to text categorization in the semantic space. Experimental results show that the method is effective on the performance of the text categorization.
分 类 号:TP334.2[自动化与计算机技术—计算机系统结构]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:216.73.216.7