基于启发式查询词选择算法的Hidden Web获取研究  被引量:1

Research on crawling Hidden Web based on heuristic query selection algorithm

在线阅读下载全文

作  者:姚全珠[1] 杨增辉[1] 张楠[1] 田元[1] 

机构地区:[1]西安理工大学计算机学院,西安710048

出  处:《计算机工程与应用》2007年第34期174-176,203,共4页Computer Engineering and Applications

基  金:国家自然科学基金(the National Natural Science Foundation of China under Grant No.50279041);陕西省自然科学基金(the Natural Science Foundation of Shaanxi Province of China under Grant No.2005F07)。

摘  要:Hidden Web因为其隐蔽性而难以直接抓取,因此成为信息检索研究的一个新领域。提出了一种获取Hidden Web信息的方法,讨论了实现的关键技术。通过设计提出的启发式查询词选择算法,提高了抓取的效率。实验证明了该模型和算法的有效性。Because of the hidden feature,Hidden Web is hard to crawl.It becomes a new direction in the field of information retrieval.In this paper a new method of Hidden Web information retrieval is proposed.It presents a generic operational model of the Hidden Web information retrieval and describes the key techniques.It introduces a new heuristic query selection algorithm which designed by this paper.Based on this technique,the crawling is more efficient.Experiments show the effectiveness of both the model and the algorithm.

关 键 词:信息检索 Hidden WEB 爬虫 启发式算法 

分 类 号:TP311.132[自动化与计算机技术—计算机软件与理论]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象