Web信息抽取技术研究进展  被引量:19

Evolution of Information Extraction Techniques on the Web

在线阅读下载全文

作  者:陈少飞[1] 郝亚南[1] 李天柱[1] 徐林昊[1] 杨文柱[1] 

机构地区:[1]河北大学数学与计算机学院,河北保定071002

出  处:《河北大学学报(自然科学版)》2003年第1期106-112,共7页Journal of Hebei University(Natural Science Edition)

摘  要:Web信息抽取技术是当今的一个研究热点。目前出现了基于不同原理的多种信息抽取技术,它们具有不同的性能。本文根据信息抽取的原理,对现有的信息抽取技术进行了分类,结合典型的系统,在语义的附加方式、模式的定义方式、规则的表现形式、语义项的定位方式、对象的定位方式等几方面进行了分析和比较,在此基础上提出了待研究的问题。Information extraction techniques on the Web are the current research hotspot. Now many information extraction techniques based on different principle have appeared and have different capabilities. In this paper, we classify the existing information extraction techniques by the principle of information extraction and analyze the methods and principles of semantic information adding, schema defining, rule expression, semantic items locating and object locating in the approaches. Based on the above survey and analysis, several open problems are mentioned.

关 键 词:WEB信息抽取技术 研究进展 HTML XML 语义 抽取模式 抽取原理 WEB查询 抽取规则 

分 类 号:TP393.092[自动化与计算机技术—计算机应用技术]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象