检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
机构地区:[1]湖南城市学院图书馆,益阳413000 [2]湖南城建职业技术学院,湘潭411101
出 处:《计算机与数字工程》2014年第6期1046-1049,共4页Computer & Digital Engineering
基 金:湖南省教育厅资助科研项目(编号:12C0995)资助
摘 要:总结了互联网信息检索的相关技术,提出了多粒度索引的技术。多粒度索引技术采用了统计学方法,综合了短语索引和词语索引的优秀思想。该方法先识别文档中包含的未登录词语,然后把识别出来的未登录词语依次放在一个扩展的词典里面。在创建索引的时候,对文本进行两趟词语切分。第一趟是采用基本的分词词典。第二趟词语切分是对上面的结果采用基于扩展分词词典的方法。基于多粒度索引技术设计了互联网信息检索系统,实验数据显示系统在准确率、召回率以及综合评分F-measure上均取得了较好的效果。Based on the technologies of Internet information retrieval ,the multi-granularity indexing technology which utilizes the statistical method to combine the phrases index and words index is proposed .This method first identifies the un-known words contained in the document and then puts these unregistered words in an extended dictionary .When the index is created ,word segmentation for the text is conducted tuice .Based on multi-granularity indexing technology ,Internet infor-mation retrieval system is designed .Experimental results show that the system has achieved good results in accuracy ,recall-ing rate and composite score F-measure .
分 类 号:TP18[自动化与计算机技术—控制理论与控制工程]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:3.139.85.192