一种用于Web信息抽取的页面信息本体自动学习方法被引量：2

An Automatic Ontology Learning Approach Based on Web Information Items for Web Information Extraction

机构地区：[1]湖南工学院计算机与信息科学系,湖南衡阳421002 [2]中南大学信息科学与工程学院,湖南长沙410083

出　　处：《计算技术与自动化》2011年第1期119-123,共5页Computing Technology and Automation

基　　金：国家自然科学基金(60873081);湖南省教育厅科研项目(09C297)

摘　　要：针对基于Web页面信息本体的信息抽取中,需人工根据待抽信息项的概念和对应的实例值来建立本体的缺点,设计一个页面信息本体的自动学习方法。论文利用前期在基于DOM的页面相似路径归纳学习算法和基于PAT-tree的自动关键词识别算法上的研究成果,使用改进的TF.IDF统计方法和复合事件的关联规则算法完成概念和概念间关系的学习,建立页面信息本体,减少建立本体的人工工作量。According to the weakness of building ontology needs manually designated concepts and instances from the basic information of web,an automatic ontology learning approach based on web information items is designed.Utilizing pre-research that an arithmetic of an inductive learning based on DOM for the similar path of information items and an approach for identifying automatic Key words based on PAT-tree,the learning for the concepts and the relation between concepts is implemented by using an approved TFIDF statistic method and an algorithm of composite event association rule,the information item ontology is built,the manual workload for building ontology is reduce

关键词：本体学习信息抽取 PAT-TREE 关联规则

分类号：TP391.1[自动化与计算机技术—计算机应用技术]

参考文献：

正在载入数据...

二级参考文献：

正在载入数据...

耦合文献：

正在载入数据...

引证文献：

正在载入数据...

二级引证文献：

正在载入数据...

同被引文献：

正在载入数据...

高级检索 检索式检索

时间限定

期刊范围

学科限定全选

高级检索 检索式检索

时间限定

期刊范围

学科限定全选

一种用于Web信息抽取的页面信息本体自动学习方法被引量：2

我的收藏

参考文献：

二级参考文献：

耦合文献：

引证文献：

二级引证文献：

同被引文献：

相关期刊文献：

相关的主题

相关的作者对象

相关的机构对象

下载全文

高级检索检索式检索

时间限定

期刊范围

学科限定全选

高级检索 检索式检索

时间限定

期刊范围

学科限定全选

一种用于Web信息抽取的页面信息本体自动学习方法 被引量：2

我的收藏

参考文献：

二级参考文献：

耦合文献：

引证文献：

二级引证文献：

同被引文献：

相关期刊文献：

相关的主题

相关的作者对象

相关的机构对象

下载全文

用户登录

高级检索检索式检索

一种用于Web信息抽取的页面信息本体自动学习方法被引量：2