检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
机构地区:[1]哈尔滨工业大学计算机科学与技术学院
出 处:《哈尔滨工业大学学报》2007年第11期1776-1779,共4页Journal of Harbin Institute of Technology
基 金:国家自然科学基金资助项目(60302021;60473139);国家高技术研究发展计划资助项目(2002AA117010-09);山西省青年科技基金资助项目(20051018)
摘 要:为解决基于模式的方法发现语义类时召回率和精确率低的问题,提出了一种基于软模式的语义类发现方法,该方法首先利用bootsrapping方法获得传统的模式,即硬模式,然后再扩展生成软模式,最后通过计算待测模式的分值实现软模式的模糊匹配,从而完成语义类的发现.在人民日报语料上测试最低召回率可达到60.1%.表明由于软模式可以包含丰富的信息,形式更加灵活,而且可进行模糊匹配,在保证系统高召回率方面表现良好.This paper presents a method of using soft pattern to discover semantic classes. In the method, "hard" patterns are obtained in a bootstrapping cycle, and then the soft pattern is generated based on the hard patterns, finally the named entities of the interested semantic classes are discovered with the fuzzy match of the soft pattern. Experiments on Chinese corpus of People' s Daily show that the lowest recall can achieve 60. 1%, which suggests that soft pattern performs well in ensuring high recall cause of its integration of rich information, flexible format and its supporting to the fuzzy match.
分 类 号:TP391[自动化与计算机技术—计算机应用技术]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:3.15.148.76