检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
机构地区:[1]解放军理工大学通信工程学院,南京210007
出 处:《计算机工程》2012年第23期57-59,62,共4页Computer Engineering
基 金:国家"863"计划基金资助项目(2010AA012404)
摘 要:在构建面向主题的信息抽取系统时,抽取需求是明确抽取任务的前提。针对自然语言描述的抽取需求导致计算资源浪费与抽取效率降低的问题,提出面向主题的信息抽取需求的形式化定义,并研究抽取需求之间的关系。采用精简需求集拆分的方法构造等价精简需求集,消除多抽取需求之间存在的冗余。实验结果证明,等价精简需求集能够提高多需求抽取任务的运行效率。In the construction of topic oriented information extraction system,extraction requirements are core of all extraction tasks.For natural language description of extraction requirements leads to a computational resource waste and extraction efficiency issues,a formal definition is proposed on the requirements of topic-oriented information extraction.On this basis,it researches on extracting relations between requirements.The reduced requirements set splitting method structural equivalences reduced requirements set,eliminate the extraction redundancy between requirements.Experimental results prove the equivalence of reduced requirements set can improve operating efficiency of the extraction tasks.
关 键 词:WEB信息抽取 主题 抽取需求 冗余分析 描述模型
分 类 号:TP311[自动化与计算机技术—计算机软件与理论]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:216.73.216.28