检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
机构地区:[1]湖南大学计算机与通信学院,长沙410082 [2]湖南大学软件学院,长沙410082
出 处:《系统仿真学报》2006年第7期1926-1929,1934,共5页Journal of System Simulation
基 金:湖南省自然科学基金项目(03JJY3089)
摘 要:文本信息检索是处理海量文本的重要手段之一,针对短查询串中出现的查全率高但查准率低的问题,引入一种基于查询扩展和分类的信息检索算法。该算法在检索的第一阶段利用自动相关反馈方法扩展用户递交的短查询串增加查询信息,在第二阶段使用文本分类技术辅助检索。分析和实验结果表明:新的算法比传统的查询扩展检索算法具有更好的查准率和查询效率。A new information retrieval algorithm based on query expansion and classification was proposed, The algorithm is based on the observation that very short queries used in information searching often result in depressed precision and impressive recall. The approach is based on pseudo-feedback and text classification, and it attempts to catch more relevant documents for user. The results of the experiment show that the algorithm proposed improves more precision and efficiency than the traditional query expansion methods,
关 键 词:向量空间模型 短查询串 查询扩展 文本分类 查准率
分 类 号:TP391[自动化与计算机技术—计算机应用技术]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:216.73.216.229