检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
作 者:李世奇[1] 赵铁军[1] 陈晨[1] 刘鹏远[1]
机构地区:[1]哈尔滨工业大学教育部-微软语言语音重点实验室,哈尔滨150001
出 处:《高技术通讯》2009年第9期926-932,共7页Chinese High Technology Letters
基 金:国家自然科学基金(60575041);863计划(2006AA01Z150)资助项目。
摘 要:提出了一种基于自适应谐振理论(ART)网络的无指导中文名词短语共指消解方法。该方法充分利用名词短语自身特征,通过改变网络参数动态调节聚类数量,有效地解决了目前聚类共指消解中输出类别数目难以确定的难题。另外采用了一种基于信息增益率的特征选择方法,减少了区分度较弱特征给聚类所带来的干扰。该方法在保证了识别正确率的前提下,不依赖人工标注语料,可直接应用于跨领域的真实文本。最后在ACE中文语料上进行了相关实验,并取得了较好的结果。This paper proposes a novel unsupervised approach for coreference resolution of Chinese based on adaptive resonance theory (ART) Networks. Through making full use of the characteristics of noun phrases and dynamically adjusting the parameters of the networks, the approach can solve the problem in the present clustering coreference resolution that the number of the output categories is hard to determine. Additionally, the approach performs a feature selection process based on the gain ratio criterion to reduce the noise created by the weak features in differentiation. The method scarcely depends on the hand-labeled corpus and can be directly applied to real texts in multiple fields while ensuring the accuracy. The experiment has shown its encouraging performance on ACE Chinese corpus.
关 键 词:共指消解 无指导学习 自适应谐振理论(ART) 自然语言处理
分 类 号:TP391.12[自动化与计算机技术—计算机应用技术]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:3.22.98.193