一种基于分类的扩展向量空间信息检索模型研究与应用  

An Research and Application of Information Retrieval Model Based on Classified Extendsion Vector Space

在线阅读下载全文

作  者:李春生[1] 程兆全[1] 赵冰冶[1] 

机构地区:[1]东北石油大学计算机学院,大庆163318

出  处:《科学技术与工程》2010年第33期8164-8167,共4页Science Technology and Engineering

摘  要:为了提高信息检索系统检索性能,针对信息检索系统中普遍使用的向量空间模型(VSM)所固有的缺陷,提出一种新的基于分类和扩展向量空间模型CE-VSM(Classifier Expand-Vector Space Model)。该模型对传统的空间向量法进行了改进,引入分词技术、朴素贝叶斯分类器和专业词库,重新定义了资源特征向量和查询索引项的内容,参考关键词出现的频率及其在所描述的资源中所起的作用等因素来计算特征索引项和资源向量的权重值。在此基础上,又对查询索引项使用了基于专业词库的扩展策略。实验证明该模型使检索能够在相对精确的范围内进行,提高检索查准率和查全率,改善了信息检索系统的性能。In order to improve the retrieval performance of information retrieval system,a new vector space model CE-VSM(Classifier Expand—Vector Space Vector Space Model) is put forward based on classification and extension,which according to the deficiency of normal vector space model(VSM) used in information retrieval system.The model modifies traditional space vector method,introduces participle technology,naive Bayes classifier and speciality lexicon,redefines the content of resource eigenvector and query index entry,calculates the weight of characteristic index entry and resource vector according to the frequency of keyword and its influence.Furthermore,expansion strategy based on professional lexicon is also uesd in query index entry.Experimental evidence shows that the model makes the retrieve running at relative accurate environment,improves precision ratio and recall ratio during retrieval and modifies the performance of information retieval system.

关 键 词:CE-VSM 朴素贝叶斯分类器 专业词典 同义扩展 

分 类 号:TP391.3[自动化与计算机技术—计算机应用技术]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象