检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
机构地区:[1]清华大学自动化系国家CIMS中心,北京100084
出 处:《计算机集成制造系统》2007年第9期1780-1786,共7页Computer Integrated Manufacturing Systems
基 金:国家863/CIMS主题资助项目(2004AA414020)~~
摘 要:通过对Web信息源中超文本标记语言表格特点的分析,提出了从超文本标记语言表格自动构建局部本体的方法。该方法包含四个步骤:采用过滤规则,区分定位表格和概念表格;以五元组序列形式化超文本标记语言表格;使用统计方法确定属性单元格;依据属性单元格间和表格间的位置关系,确定属性间关系。实验结果证明,该方法具有较高的准确性。Through analyzing characteristics of HTML tables in Web information sources, a method of automatically extracting local ontology via HTML tables was presented. This method consisted of four basic steps: (1) adopting two filtering rules to distinguish between position-tables and concept-tables, (2) formalizing HTML tables, (3) using statistics to decide which cells were attribute cells, (4) employing the position relationships between attribute cells and between HTML tables to ascertain the relationships among attributes. Finally, the accuracy of this method was validated by experiments.
关 键 词:局部本体 定位表格 概念表格 属性单元格 值单元格
分 类 号:TP319[自动化与计算机技术—计算机软件与理论]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:18.118.99.234