检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
作 者:张志强[1] 李天柱[1] 张波[1] 陈少飞[1] 郝亚南[1]
机构地区:[1]河北大学数学与计算机学院,河北保定071002
出 处:《河北大学学报(自然科学版)》2004年第2期212-218,共7页Journal of Hebei University(Natural Science Edition)
摘 要:基于文档结构的信息抽取工具很多 ,XWrap ,W 4F ,Lixto以及自主开发的PQagent是其中比较有代表性的几个 .这几个工具采用了不同的规则描述形式 ,XWrap ,W 4F ,Lixto使用的是自定义的规则描述形式 ,PQagent采用了通用的规范XQuery来描述规则 .现将XWrap ,W 4F ,Lixto使用的规则描述形式与PQagent采用的XQuery进行比较 ,说明了采用XQuery描述抽取规则的优越性 .There are many information extraction tools based on structure.Among them,XWrap,W4F,Lixto and PQagent which is developed by ourself are pretty representative.Each one uses a different way to describe their extraction rules.XWrap,W4F and Lixto predefine different ways to describe their rules,as while PQagent using the universal criterion--XQuery.Here,XQuery is compared with the ways respectively used by XWrap,W4F and Lixto,and conclusion is drawn that there is more advantage to use XQuery.
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:216.73.216.117