检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
机构地区:[1]国家数字交换系统工程技术研究中心,河南郑州450002
出 处:《计算机工程与设计》2008年第23期6012-6015,共4页Computer Engineering and Design
基 金:国家863高技术研究发展计划基金项目(2007AA01Z434);2007年度河南省青年科学基金项目(074100510023)。
摘 要:向量空间模型是有代表性的信息检索模型之一,针对该模型存在的问题进行了研究和探讨。在仅用统计词频表示文档向量方面,引入知网作为语义知识库,提出基于概念的特征选择模型;在因词语的同义和多义,不能满足文档向量相互独立方面,提出潜在语义索引模型。实验验证了改进后的检索模型更能体现文本的内容,降低文本向量的维数,提高检索的准确率。Vector space model is one of the representative information retrieval models, the problems of the model are researched and discussed. On the aspect of the representing of text vector by statistical term frequency, HowNet is taken as semantic repository, and the model of feature selection based on concept is presented. On the aspect of dissatisfying the independence of text vector as the synonymy and polysemy of words, the model of latent semantic indexing is presented. The experiment demonstrates the improvement of retrieval model can expresses the contents of texts better, the dimensions of text vectors is reduced and the precision of retrieval is advanced.
关 键 词:向量空间模型 基于概念的特征选择 潜在语义索引 知网 奇异值分解
分 类 号:TP391[自动化与计算机技术—计算机应用技术]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:216.73.216.56