即时定向新闻采集技术研究  被引量:3

An Efficient Approach to Just-In-Time Focused News Acquisition

在线阅读下载全文

作  者:王辛[1] 黄穗[1] 龙舜[1,2] 

机构地区:[1]暨南大学计算机科学系,广东广州510632 [2]广东省公共网络安全风险评价与预警应急技术研究中心,广东广州510632

出  处:《计算机工程与科学》2012年第9期180-183,共4页Computer Engineering & Science

摘  要:互联网的迅速发展带动了信息量的爆炸性增加。如何更快地采集所需信息一直是国内外研究和开发的热点。近年来,不断增长的对特定信息(例如特定领域的新闻)的需求要求有针对性地从指定的网站即时采集相关信息。这些新闻一般具有不可预见性、更新频率较快、时效性强等特点。这要求我们必须能针对这些特点实现即时定向的采集。本文提出了一种有效抓取网页并进行分析的方法,实践表明取得了满意的效果。The rapid development of the Internet leads to the explosive increase in the amount of in- formation. How to collect the required information quickly has been a hot topic in both industry and research areas. In recent years, the growing demand for specific information (such as news of specific topics) information should be acquired from some specified sites in a just-in-time manner. However,they are generally unpredictable,of quicker update frequency,more time-sensitive, and therefore more difficult to acquire just-in-time. This paper proposes a novel approach to tackle this problem,whose efficiency has been demonstrated in practice.

关 键 词:新闻采集 爬虫 即时 

分 类 号:TP393[自动化与计算机技术—计算机应用技术]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象