检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
机构地区:[1]解放军理工大学通信工程学院,江苏南京210007 [2]解放军理工大学训练部,江苏南京210007
出 处:《微电子学与计算机》2005年第2期188-192,共5页Microelectronics & Computer
基 金:国家自然科学基金项目资助:(60303024)
摘 要:语义模式的自动获取是解决信息抽取系统可移植性问题的关键之一。文章提出了一种基于自举原理的语义模式自动获取方法。该方法是一种新的双循环自举机制,由内自举和外自举两部分组成。内自举借助通用的《同义词词林》扩张模式的语义范围;外自举利用模式之间的交叉项作为链接点自动寻找新模式。用于从未标注的文本中自动发现语义模式,启动时只须用户提供少量的抽取示例作为种子,运行中即可增量式地发现新语义模式。测试表明,该方法产生的语义模式在信息抽取中具有较好的准确率和召回率。Automatic semantic pattern acquisition is a key aspect for addressing the portability problem of information extraction systems. A method based on bootstrapping principle is presented to automatically acquire semantic patterns. The method has a novel dual-cycle bootstrapping mechanism composed of an inner bootstrapping and an outer bootstrapping. The inner bootstrapping utilizes Synonymy Thesaurus to expand pattern semantics. The outer bootstrapping uses intersections among patterns as link points to find new patterns. Starting with a small set of information extraction samples as seeds, the method can incrementally identify new patterns from un-annotated text. Tests show semantic patterns produced with the method have good result for both precision and recall in information extraction.
分 类 号:TP391[自动化与计算机技术—计算机应用技术]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:216.73.216.229