基于概念分析的主题爬虫设计  被引量:11

Design of Theme Crawler Based on Concept Analysis

在线阅读下载全文

作  者:汪涛[1] 樊孝忠[1] 顾益军[1] 刘林[1] 

机构地区:[1]北京理工大学信息科学技术学院计算机科学工程系

出  处:《北京理工大学学报》2004年第10期890-893,共4页Transactions of Beijing Institute of Technology

基  金:扬州万方电子技术有限责任公司合作项目(2003.08)

摘  要:研究改进主题爬虫设计的方法,用高效的主题爬虫取代传统搜索引擎中的普通爬虫,以更高的精度完成定向信息采集.在成功实现基于关键词的主题爬虫的基础上,提出了基于概念的主题相关度分析算法,给出了基于概念分析的主题爬虫的实现方案.比较两种主题爬虫工作的实验结果,显示爬虫的性能得到了提高,论证了该设计的可行性与可操作性,为实现准确的定向信息采集奠定了良好的基础.Method of improving the design of theme crawler is discussed. A more efficient theme crawler can replace the normal crawler in the traditional search engine to complete directional information collection with higher precision. With the success of the theme crawler based on

关 键 词:搜索引擎 主题爬虫 概念分析 相关度 信息采集 

分 类 号:TP393[自动化与计算机技术—计算机应用技术]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象