从HTML表格自动构建局部本体方法的研究  被引量:1

Automatically extracting local ontologies via HTML tables

在线阅读下载全文

作  者:范莉娅[1] 肖田元[1] 

机构地区:[1]清华大学自动化系国家CIMS中心,北京100084

出  处:《计算机集成制造系统》2007年第9期1780-1786,共7页Computer Integrated Manufacturing Systems

基  金:国家863/CIMS主题资助项目(2004AA414020)~~

摘  要:通过对Web信息源中超文本标记语言表格特点的分析,提出了从超文本标记语言表格自动构建局部本体的方法。该方法包含四个步骤:采用过滤规则,区分定位表格和概念表格;以五元组序列形式化超文本标记语言表格;使用统计方法确定属性单元格;依据属性单元格间和表格间的位置关系,确定属性间关系。实验结果证明,该方法具有较高的准确性。Through analyzing characteristics of HTML tables in Web information sources, a method of automatically extracting local ontology via HTML tables was presented. This method consisted of four basic steps: (1) adopting two filtering rules to distinguish between position-tables and concept-tables, (2) formalizing HTML tables, (3) using statistics to decide which cells were attribute cells, (4) employing the position relationships between attribute cells and between HTML tables to ascertain the relationships among attributes. Finally, the accuracy of this method was validated by experiments.

关 键 词:局部本体 定位表格 概念表格 属性单元格 值单元格 

分 类 号:TP319[自动化与计算机技术—计算机软件与理论]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象