基于叙词表的主题爬虫技术研究  被引量:8

The Focused-crawler Based on Thesaurus

在线阅读下载全文

作  者:夏崇镨[1] 康丽[1] 

机构地区:[1]中国农业大学计算机系,北京100083

出  处:《现代图书情报技术》2007年第5期41-44,共4页New Technology of Library and Information Service

基  金:北京市自然科学基金资助项目"基于遗传算法网页信息搜索技术"(项目编号:4062013)的研究成果之一

摘  要:将叙词表同传统的信息检索技术相结合,提出用叙词表的族对爬虫的主题进行描述的方法并用该方法设计实现一主题爬虫。实验结果证明本文提出模型和算法的有效性。Combining the thesaurus with the traditional information retrieval technology, a new method is presented that family in thesaurus is used to describe the predefined topic. Also develops a focused - crawler based on this method. On which we compare its efficiency with other well - known Web search engine. The experimental results showes the effectiveness of our models and algorithms.

关 键 词:主题爬虫 叙词表 搜索引擎 

分 类 号:TP391.3[自动化与计算机技术—计算机应用技术]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象