检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
机构地区:[1]上海交通大学外国语学院,上海200030 [2]山东济南广播电视大学信息学院,济南250001 [3]中国冶金地质勘查工程总局山东局,济南250014
出 处:《吉林大学学报(信息科学版)》2007年第3期299-299,共1页Journal of Jilin University(Information Science Edition)
基 金:国家自然科学基金资助项目(60572159)
摘 要:为了比较各模型的性能,研究进一步改进文本信息检索各类模型的可能方法,综合已有的试验及发表的研究报告,概述文本信息检索模型中一类模型——代数模型概念和研究现状,并分析了目前文本信息检索的相关性、相似度、召回率、准确率等概念。结果表明,这几个模型尽管来源于神经网络、向量空间等不同的思想,广义向量空间模型、潜在语义标引模型的计算复杂度比向量空间模型高,但此类模型依据评测在准确率和召回率上相近,经典向量空间模型相对而言,有简单、复杂度低和可作为检索框架,而不仅仅是检索模型的特点。为便于研究者研究、改进、评测信息检索的代数模型,介绍并评价了权威的TREC(The Text Retrieval Conference)和两个代表性的研究系统smart和lemur。As the importance of the text retrieval increase, many models have been presented. To compare the performance of models and search for the possible approach to improve the models, the article outlines one kind of IR model the algebraic models and the situations of contemporary research, based on the experiments and research of the domain, analysis's relevance, similarity, algebraic model, recall, precision, concluding that the algebraic models are all similar in their recall and precision and the space vector model is simple, low-complexity, and a retrieval frame rather than only a retrieval model although these models are resulted from different ideas. The TREC (Text Retrieval Conference) and some software for experiment and research are introduced and evaluated briefly for researcher to study and develop the algebraic model.
关 键 词:文本信息检索 相关性 相似度 代数模型 召回率 准确率
分 类 号:TP311.13[自动化与计算机技术—计算机软件与理论]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:3.149.249.184