基于查询扩展和分类的信息检索算法  被引量:10

Information-retrieval Algorithm Based on Query Expansion and Classification

在线阅读下载全文

作  者:岳文[1] 陈治平[1] 林亚平[2] 

机构地区:[1]湖南大学计算机与通信学院,长沙410082 [2]湖南大学软件学院,长沙410082

出  处:《系统仿真学报》2006年第7期1926-1929,1934,共5页Journal of System Simulation

基  金:湖南省自然科学基金项目(03JJY3089)

摘  要:文本信息检索是处理海量文本的重要手段之一,针对短查询串中出现的查全率高但查准率低的问题,引入一种基于查询扩展和分类的信息检索算法。该算法在检索的第一阶段利用自动相关反馈方法扩展用户递交的短查询串增加查询信息,在第二阶段使用文本分类技术辅助检索。分析和实验结果表明:新的算法比传统的查询扩展检索算法具有更好的查准率和查询效率。A new information retrieval algorithm based on query expansion and classification was proposed, The algorithm is based on the observation that very short queries used in information searching often result in depressed precision and impressive recall. The approach is based on pseudo-feedback and text classification, and it attempts to catch more relevant documents for user. The results of the experiment show that the algorithm proposed improves more precision and efficiency than the traditional query expansion methods,

关 键 词:向量空间模型 短查询串 查询扩展 文本分类 查准率 

分 类 号:TP391[自动化与计算机技术—计算机应用技术]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象