检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
作 者:仲兆满 李恒 管燕 李慧 ZHONG Zhaoman;LI Heng;GUAN Yan;LI Hui(School of Computer Engineering,Jiangsu Ocean University,Lianyungang,Jiangsu 222005,China;Jiangsu Academy of Marine Resources Development(Lianyungang),Lianyungang,Jiangsu 222005,China)
机构地区:[1]江苏海洋大学计算机工程学院,江苏连云港222005 [2]江苏省海洋资源开发研究院(连云港),江苏连云港222005
出 处:《中文信息学报》2024年第7期73-83,共11页Journal of Chinese Information Processing
基 金:国家自然科学基金(72174079);江苏省高校自然科学研究项目(19KJB520004);江苏省高校科研实践创新计划项目(KYCX20_2931)。
摘 要:随着互联网的飞速发展,从微博、贴吧、论坛、新闻网站等媒体获取关注的事件信息已经是互联网信息处理系统的基本功能。然而,面对大数据时代的媒体资源,如何全面、快速地获取关注的事件信息是值得深入研究的问题。该文针对事件信息采集效率低下的问题,揭示了事件之间的约束效应,为事件监测项、最简事件监测项的要素组成提供了指导;分析了最简事件监测项之间的相交关系,提出了事件监测项的归约方法,减少了用于搜采的监测项的数量。以一个市级地域SaaS平台和一个消防行业SaaS平台中的事件信息采集为实验对象,面向主流的内置搜索引擎,在事件监测项选取率和事件信息采集效率两方面进行了实验评测。结果表明,该文提出的事件监测项归约方法,减少了信息采集的次数,改善了事件信息采集的性能。With the rapid development of the Internet,crawling event information from various media,such as microblog,post bar,forum and news website,becomes essential to Internet information processing systems.Facing with these media resources in the era of big data,how to comprehensively and quickly obtain concerned event information is worthy of further study.We reveal event constraint effect,which provides the guideline for the structure of event monitoring term and simplest-event monitoring terms,and analyze the overlapping relation between simplest-event monitoring terms.We propose the method of reducing event monitoring terms,which reduces the number of monitoring terms for event search crawling.Taking municipal regional SaaS platform and fire control industry SaaS platform,we conduct an experiment with mainstream built-in search engines to evaluate the selection ration of event monitoring terms and event crawling efficiency.The experimental results show that the proposed reduction method of event monitoring term reduces the number of crawling information and improves the performance of event crawling.
关 键 词:事件信息采集 内置搜索引擎 事件约束效应 事件监测项归约
分 类 号:TP391[自动化与计算机技术—计算机应用技术]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:18.116.165.143