检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
机构地区:[1]郑州成功财经学院信息工程系,河南郑州451200 [2]武汉理工大学信息工程学院,湖北武汉430070 [3]铁道警察学院公安技术系,河南郑州450053
出 处:《计算机工程与设计》2015年第5期1362-1367,共6页Computer Engineering and Design
基 金:公安部重大基金项目(201202ZDYJ017);河南省教育厅科学技术研究重点基金项目(14A520011)
摘 要:为提高微博搜索的准确性,提出一种适应性的微博消息索引模式。将微博消息的转发和回复表示为树形结构并进行编码;提出一种基于内容和排名的索引模式,根据新消息的到来适应性地调整内存中的索引数据;为避免检索过程扫描整个微博数据集,提出一种Top-k阈值优化方法。Twitter数据实验结果表明,该模式降低了微博数据索引时的时间和空间开销,其性能随着时间的推移比较稳定。To improve the accuracy of Microblog searching,an adaptive Microblog message indexing schema was proposed. Firstly,trees were constructed according to the forward and reply of messages,and these trees were encoded.Secondly,content and rank based indexing schema was proposed,and the index structure in memory was updated adaptively when a new message came.Finally,to avoid scanning the whole Microblog data,a Top-k threshold optimization method was proposed.Results of ex-periments on Twitter data set show that,the proposed index schema reduces the time and space cost while indexing the Microb-log messages,and its performance is stable along with time.
分 类 号:TP311[自动化与计算机技术—计算机软件与理论]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:216.73.216.158