检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
机构地区:[1]中国科学院国家科学图书馆,北京100190 [2]中国科学院研究生院,北京100190 [3]西南大学计算机与信息科学学院,重庆400715
出 处:《情报理论与实践》2009年第6期102-105,共4页Information Studies:Theory & Application
摘 要:信息环境的异构性、动态性与海量性使传统基于自然文本的信息检索方法与技术面临极大挑战,集成概念空间理论与潜在语义索引技术能为这种困境提供一些解决方案。在分析概念空间内涵与特征的基础上,利用潜在语义索引原理讨论了概念提取方法、同义词近义词处理方法及基准向量的生成方法,分析了网络条件下基于概念空间的文本分类、聚类检索基本机制,最后给出了完善概念空间的自学习机制。The traditional information retrieval method based on natural text has confronted with great challen- ges in the heterogeneous, dynamic and magnanimous information environment, and the integration of concept space and latent semantic index may be a solution to this predicament. Based on the analysis of the connotation and char- acteristics of concept space, this paper uses the principle of latent semantic index to discuss the methods of extrac- ting concept, dealing with synonym and near synonym, and creating normal vector. The basic mechanism of text classification and clustering retrieval based on concept space under the network conditions are analyzed. Finally, the self - learning mechanism of improving concept space are given.
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:3.148.200.110