检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
作 者:杨喜权[1] 孔德冉[1] 施华[1] 孙娜[1] 张野[1]
出 处:《信息技术》2009年第9期69-72,共4页Information Technology
摘 要:针对Web信息在抽取过程中数据精确率不足的问题,提出了一种基于领域本体的Web信息抽取方法。该方法使得领域本体中概念的层次关系和属性的特点得到了充分利用,本体的构造在抽取过程中逐渐得到完善,从而增强本体对应用领域的描述能力。实验证明文中的方法对Web页面的信息抽取具有较高的效率。Dealing with the data inaccuracy in the process of the extraction,this paper proposes a Web information extraction method based on specific domain ontology.It makes full use of the hierarchical relations and the characteristics of attribution in domain ontology,meanwhile,ontology structure is gradually perfected in the process of the extraction.Thereby the ability to describe ontology in application area has been enhanced.It turns out that it has a higher efficiency in the extraction of Web pages.
关 键 词:Web抽取 领域ONTOLOGY 层次关系
分 类 号:TP393[自动化与计算机技术—计算机应用技术]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:216.73.216.117