主题爬虫技术研究综述  被引量:6

Discuss of Subject Crawler Technology

在线阅读下载全文

作  者:陈方[1] 谭爱平[1] 成亚玲[1] 文益民[1] 

机构地区:[1]湖南工业职业技术学院,湖南长沙410208

出  处:《湖南工业职业技术学院学报》2008年第5期13-16,共4页Journal of Hunan Industry Polytechnic

摘  要:万维网信息的"海量"增长,传统的通用搜索引擎不能提供用户理想的结果页面,与用户关心的主题或领域相关的主题爬虫应运而生。根据研究的发展现状,对普通爬虫技术、主题爬虫技术(基于关键词、概念分析、链接分析对主题爬虫的改进)作了介绍与对比,并在此基础上提出了主题爬虫今后的一些研究方向。World Wide Web information "great capacity for liquor" increases by, the tradition be applied or used universally searches for an engine being able to not provide ideal result of consumer arising at the historic moment with the subject that the consumer cares for or the pertinent field subject Crawler face to face page. Present situation the main body of a book is studied in the light of, the technology (owing to that the keyword,concept analysis, interlinkage analyses the improvement to subject Crawler) has done some direction studying of the days to come having introduced and bringing forward the subject Crawler on contrast, and here basis to the average Crawler technology, subject Crawler.

关 键 词:普通爬虫 主题爬虫 链接分析 主题相关度 页面概念 主题概念 

分 类 号:TP316.8[自动化与计算机技术—计算机软件与理论]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象