基于用户群的智能主题爬虫  被引量:3

Intelligent Topic Crawler Based on Users Community

在线阅读下载全文

作  者:赵燕[1] 陈晓云[1] 莫明辉[1] 汤勇[1] 

机构地区:[1]兰州大学信息科学与工程学院,甘肃兰州730000

出  处:《广西师范大学学报(自然科学版)》2007年第2期230-233,共4页Journal of Guangxi Normal University:Natural Science Edition

基  金:甘肃省自然科学基金资助项目(3ZS051-A25-035)

摘  要:提出一个基于用户群的智能主题爬虫系统CITC。它首先对用户群日志进行挖掘,得到相应的知识库。在知识库的指导下,CITC采用多重选择策略,对网页进行选择性爬取。实验结果表明,此系统能够基于用户群兴趣有效地抓取目的网页。A Community-Specific Intelligent Topic Crawler is introduced. This system mines the Web logs of community, which results in corresponding knowledge base. With the guidance of the knowledge base and multi-layer selective strategy,CITC fetch relevant pages selectively. The experiment shows that this system can fetch relevant pages efficiently based on the interest of user community.

关 键 词:用户群 网页对偶筛选 知识库 主题爬虫 相关度 

分 类 号:TP393[自动化与计算机技术—计算机应用技术]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象