一种基于软模式的语义类发现方法  

Semantic classes discovery based on soft pattern

在线阅读下载全文

作  者:谭红叶[1] 赵铁军[1] 

机构地区:[1]哈尔滨工业大学计算机科学与技术学院

出  处:《哈尔滨工业大学学报》2007年第11期1776-1779,共4页Journal of Harbin Institute of Technology

基  金:国家自然科学基金资助项目(60302021;60473139);国家高技术研究发展计划资助项目(2002AA117010-09);山西省青年科技基金资助项目(20051018)

摘  要:为解决基于模式的方法发现语义类时召回率和精确率低的问题,提出了一种基于软模式的语义类发现方法,该方法首先利用bootsrapping方法获得传统的模式,即硬模式,然后再扩展生成软模式,最后通过计算待测模式的分值实现软模式的模糊匹配,从而完成语义类的发现.在人民日报语料上测试最低召回率可达到60.1%.表明由于软模式可以包含丰富的信息,形式更加灵活,而且可进行模糊匹配,在保证系统高召回率方面表现良好.This paper presents a method of using soft pattern to discover semantic classes. In the method, "hard" patterns are obtained in a bootstrapping cycle, and then the soft pattern is generated based on the hard patterns, finally the named entities of the interested semantic classes are discovered with the fuzzy match of the soft pattern. Experiments on Chinese corpus of People' s Daily show that the lowest recall can achieve 60. 1%, which suggests that soft pattern performs well in ensuring high recall cause of its integration of rich information, flexible format and its supporting to the fuzzy match.

关 键 词:模式 软模式 语义类 命名实体 

分 类 号:TP391[自动化与计算机技术—计算机应用技术]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象