基于本体和DOM树的Web信息抽取技术研究  被引量:3

Study on the Web Information Extraction Technology Based on the Ontolgy and DOM Tree

在线阅读下载全文

作  者:吴恒亮[1] 

机构地区:[1]山东工商学院管理科学与工程学院,山东烟台264005

出  处:《情报科学》2010年第7期1055-1059,共5页Information Science

基  金:山东省高校人文社会科学研究计划(J09WJ72)

摘  要:Web信息抽取是一个很大、很复杂的课题,涉及人工智能、机器学习等多个领域,本文研究的主要内容是如何将网页中的非结构化信息转化成结构化信息。首先介绍了本体的基本知识,然后重点讨论了基于本体和网页DOM树的网页信息抽取技术的实现过程。Web information extraction is a very big and difficulty research subject which involves many fields, such as artificial intelligence, machinery learning, and so on. The main research content of this article is focused on how to transform non-structured information into structured information in web pages. At first, this article introduces lots of basic knowledge about ontology, then puts more emphasis on discussion about the realization process of web extraction technology based on ontology and DOM tree.

关 键 词:本体 DOM树 WEB信息 抽取技术 

分 类 号:G350[文化科学—情报学]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象