检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
机构地区:[1]暨南大学计算机科学系,广东广州510632 [2]广东省公共网络安全风险评价与预警应急技术研究中心,广东广州510632
出 处:《计算机工程与科学》2012年第9期180-183,共4页Computer Engineering & Science
摘 要:互联网的迅速发展带动了信息量的爆炸性增加。如何更快地采集所需信息一直是国内外研究和开发的热点。近年来,不断增长的对特定信息(例如特定领域的新闻)的需求要求有针对性地从指定的网站即时采集相关信息。这些新闻一般具有不可预见性、更新频率较快、时效性强等特点。这要求我们必须能针对这些特点实现即时定向的采集。本文提出了一种有效抓取网页并进行分析的方法,实践表明取得了满意的效果。The rapid development of the Internet leads to the explosive increase in the amount of in- formation. How to collect the required information quickly has been a hot topic in both industry and research areas. In recent years, the growing demand for specific information (such as news of specific topics) information should be acquired from some specified sites in a just-in-time manner. However,they are generally unpredictable,of quicker update frequency,more time-sensitive, and therefore more difficult to acquire just-in-time. This paper proposes a novel approach to tackle this problem,whose efficiency has been demonstrated in practice.
分 类 号:TP393[自动化与计算机技术—计算机应用技术]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:216.73.216.30