主题搜索引擎中网络蜘蛛搜索策略的研究  被引量:1

Study of Search Strategy in Topic-oriented Web Spider for Topic-driven Search Engine

在线阅读下载全文

作  者:王明国[1] 胡敬仓[1] 

机构地区:[1]国电南瑞科技股份有限公司,南京210061

出  处:《微处理机》2011年第4期34-37,共4页Microprocessors

摘  要:主题网络蜘蛛的搜索策略是主题搜索引擎的核心部分,是近年来主题搜索引擎研究中的热点问题之一。深入研究了主题网络蜘蛛的关键技术,阐述了多线程网络蜘蛛的实现过程,并对传统的VSM算法和PageRank算法进行了改进,提高了主题网络蜘蛛采集信息的有效性和准确性。The search strategy in topic-oriented web spider is the key component of topic-driven search engine,and is really hot in research in recent years.Based on in-depth research in the search strategy in topic-driven search engine,this article expounds the development processes of the multi-thread web spider,at the same time,improves the traditional VSM algorithm and the PageRank algorithm,and enhances the validation and accuracy of information collection for topic-oriented web spider.

关 键 词:搜索引擎 网络蜘蛛 搜索策略 主题相关 向量空间模型 网页级别 

分 类 号:TP309.5[自动化与计算机技术—计算机系统结构]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象