基于规则集的Deep Web信息检索  

Rules-based Deep Web Information Retrieval

在线阅读下载全文

作  者:杨巨峰[1] 史广顺[1] 赵玉娟[1] 王庆人[1] 

机构地区:[1]南开大学机器智能研究所,天津300071

出  处:《计算机工程》2008年第13期51-53,共3页Computer Engineering

基  金:天津市自然科学基金资助项目(05YFJMJC01500)

摘  要:提出一种基于规则集的新型Deep Web信息检索模型。该模型包含4个层次,主要处理环节如任务分派、信息提取、数据清洗等引入了Deep Web特有的结构规则、逻辑规则和应用规则协助工作。把该模型应用于科技文献检索、电子机票定购和工作简历搜索3个领域,实验结果证明该模型灵活、可信,有效信息查全率达到96%以上。This paper proposes a novel rules-based model to extract data from Deep Web pages. The model comprises four layers, main processing parts as task allocation, information extraction, data cleaning which work based on the rules of structure, logic and application. It applies the new model to three intelligent system, scientific paper retrieval, electronic ticket ordering and resume searching. Experimental results show that the proposed method is robust and feasible.

关 键 词:信息检索 深层网络 规则集 数据提取 

分 类 号:TP311[自动化与计算机技术—计算机软件与理论]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象