检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
机构地区:[1]河南科技大学电子信息工程学院,河南洛阳471003
出 处:《计算机应用研究》2005年第7期36-38,59,共4页Application Research of Computers
基 金:国家教育部科研基金重点项目(200305);河南省自然科学基金资助项目(0311012600)
摘 要:以向量空间模型作为Web文本的表示方法,结合Web文本的结构特征对向量空间模型中的特征选择算法进行了分析并加以改进。在改进的算法中,体现出了特征词在Web文档结构中的位置信息;引入了信息论中熵的概念,用词的熵函数对权值进行调整,从而更加准确地选取有效的特征词。实验验证了改进算法的可行性和有效性。This paper uses vector space model as the description of the Web text, analyses the feather selection algorithm and brings forward an improved algorithm in view of the construct character of the Web text. The new algorithm describes the situation information of the feather terms in Web text, introduces the concept of entropy and adjusts the weig hting by the entropy-function of the words, thus it can select feather terms more effectively. The experiment shows the feasibility and the validity of this method in feather selection.
分 类 号:TP393[自动化与计算机技术—计算机应用技术]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:216.73.216.177