基于多粒度索引的互联网信息检索系统  

Internet Information Retrieval System Based on the Multi Granularity Index

在线阅读下载全文

作  者:曹异卿[1,2] 唐俊[2] 

机构地区:[1]湖南城市学院图书馆,益阳413000 [2]湖南城建职业技术学院,湘潭411101

出  处:《计算机与数字工程》2014年第6期1046-1049,共4页Computer & Digital Engineering

基  金:湖南省教育厅资助科研项目(编号:12C0995)资助

摘  要:总结了互联网信息检索的相关技术,提出了多粒度索引的技术。多粒度索引技术采用了统计学方法,综合了短语索引和词语索引的优秀思想。该方法先识别文档中包含的未登录词语,然后把识别出来的未登录词语依次放在一个扩展的词典里面。在创建索引的时候,对文本进行两趟词语切分。第一趟是采用基本的分词词典。第二趟词语切分是对上面的结果采用基于扩展分词词典的方法。基于多粒度索引技术设计了互联网信息检索系统,实验数据显示系统在准确率、召回率以及综合评分F-measure上均取得了较好的效果。Based on the technologies of Internet information retrieval ,the multi-granularity indexing technology which utilizes the statistical method to combine the phrases index and words index is proposed .This method first identifies the un-known words contained in the document and then puts these unregistered words in an extended dictionary .When the index is created ,word segmentation for the text is conducted tuice .Based on multi-granularity indexing technology ,Internet infor-mation retrieval system is designed .Experimental results show that the system has achieved good results in accuracy ,recall-ing rate and composite score F-measure .

关 键 词:互联网 信息检索 多粒度索引 

分 类 号:TP18[自动化与计算机技术—控制理论与控制工程]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象