基于ART网络的无指导中文共指消解方法  

An unsupervised approach based on ART network for coreference resolution of Chinese

在线阅读下载全文

作  者:李世奇[1] 赵铁军[1] 陈晨[1] 刘鹏远[1] 

机构地区:[1]哈尔滨工业大学教育部-微软语言语音重点实验室,哈尔滨150001

出  处:《高技术通讯》2009年第9期926-932,共7页Chinese High Technology Letters

基  金:国家自然科学基金(60575041);863计划(2006AA01Z150)资助项目。

摘  要:提出了一种基于自适应谐振理论(ART)网络的无指导中文名词短语共指消解方法。该方法充分利用名词短语自身特征,通过改变网络参数动态调节聚类数量,有效地解决了目前聚类共指消解中输出类别数目难以确定的难题。另外采用了一种基于信息增益率的特征选择方法,减少了区分度较弱特征给聚类所带来的干扰。该方法在保证了识别正确率的前提下,不依赖人工标注语料,可直接应用于跨领域的真实文本。最后在ACE中文语料上进行了相关实验,并取得了较好的结果。This paper proposes a novel unsupervised approach for coreference resolution of Chinese based on adaptive resonance theory (ART) Networks. Through making full use of the characteristics of noun phrases and dynamically adjusting the parameters of the networks, the approach can solve the problem in the present clustering coreference resolution that the number of the output categories is hard to determine. Additionally, the approach performs a feature selection process based on the gain ratio criterion to reduce the noise created by the weak features in differentiation. The method scarcely depends on the hand-labeled corpus and can be directly applied to real texts in multiple fields while ensuring the accuracy. The experiment has shown its encouraging performance on ACE Chinese corpus.

关 键 词:共指消解 无指导学习 自适应谐振理论(ART) 自然语言处理 

分 类 号:TP391.12[自动化与计算机技术—计算机应用技术]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象