一种新型的基于样本的Web信息检索技术  被引量:5

A new technology on information retrieval based on samples

在线阅读下载全文

作  者:黄骥[1] 姜利群[1] 殷兆麟[1] 

机构地区:[1]中国矿业大学计算机学院,徐州221008

出  处:《微计算机信息》2009年第3期238-239,269,共3页Control & Automation

基  金:山东省自然科学基金(Y2005G13)移动计算平台的研究

摘  要:本文提出了一种新型的基于样本的信息检索方法。首先,通过归纳学习不同站点的样本页面,生成抽取规则;然后,用这些规则把不同站点页面的信息抽取出来,把这些信息整合到一个虚拟的关系数据库中;最后,可以直接检索数据库中的信息。从而,一次可以检索多个站点的信息,大大提高了检索效率。This thesis brings forward a new information retrieval method based on samples. First of all, we get the extraction regulations through Inductive Learn the samples from different websites. Secondly, we extract information from different website pages by these extraction regulations and put it into a Relational Database. Finally, we retrieve information directly from the database. Thereby, we can retrieve several websites' information at one time. Retrieval efficiency is improved greatly.

关 键 词:包装器 中介器 样本 

分 类 号:TP393[自动化与计算机技术—计算机应用技术]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象