基于Deep Web的信息采集系统  被引量:3

An Information Extraction System Based on Deep Web

在线阅读下载全文

作  者:王冉冉[1] 王刚[1] 黄青松[1] 

机构地区:[1]昆明理工大学信息工程与自动化学院,云南昆明650051

出  处:《计算机技术与发展》2007年第10期171-173,177,共4页Computer Technology and Development

基  金:国家教育部春晖计划(Z2005-1-53004)

摘  要:随着互联网技术的迅速发展,大量结构化的高质量信息被埋入网络,却无法被传统的搜索引擎检索到,进而难以被挖掘利用。针对这一现象,提出了基于Deep Web的信息采集系统,设计了基于Web的查询方式,并结合数据挖掘的相关技术,获取并挖掘深网信息资源,解决传统手工采集信息的弊端,提高系统的使用效率,避免人工搜集时间和费用上的开销,降低成本,便于维护。并且正在云南省大型仪器协作共用网络平台的建设中尝试实现这个子系统的设计。With the rapid development of Intemet technology, a large amount of structured and high - quality information is embedded into Internet. However, the information cannot be retrieved by traditional search engine and then it is difficult to mine and make full use of it. In view of this phenomenon, presents a system based on the deep Web information extraction, designs a query .schema based on the Web, and combines some relevant technology of data mining. As a result,can get and mine the information which is in the Deep Web. At the same time, it resolves the traditional drawback of collecting information artificially, enhances the efficiency of the system, avoids the expenses on collection time and the expense, reduces the cost and maintains easily. And it has betel designing in the Yunnan province scientific instrument shared network platform.

关 键 词:DEEP WEB 信息采集 查询接口 数据挖掘 

分 类 号:TP391.1[自动化与计算机技术—计算机应用技术]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象