词义标注一致性检验系统的设计与实现  被引量:3

A Checking Method for Word Sense Tagging Consistency

在线阅读下载全文

作  者:乔剑敏[1] 张仰森[1] 

机构地区:[1]北京信息科技大学智能信息处理研究所,北京100192

出  处:《中文信息学报》2010年第4期44-51,共8页Journal of Chinese Information Processing

基  金:国家自然科学基金项目资助(60873013);北京市自然科学基金B类重点项目资助(KZ200811232019);北京大学计算语言学教育部重点实验室开放课题基金资助(KLCL-1005);北京市属市管高等学校人才强教计划资助项目(PHR201007131)资助

摘  要:词义消歧是自然语言处理领域的一个重要研究课题。词义标注的一致性将直接影响语料库的建设质量,进而直接或间接影响到其相关的应用领域。由于语言本身的复杂性与发展性以及算法设计的难点和缺陷,目前各种词义标注的算法与模型还不能百分之百正确地标注词义,即不能保证词义消歧的正确性与一致性。而人工校验在时间、人力方面的投入是个难题。该文在对《人民日报》语料、语句相似度算法和语义资源《知网》研究的基础上,提出了对《人民日报》语料词义标注进行一致性检验的方法。实验结果表明,此方法是有效的。Word sense disambiguation(WSD) is an important issue with wide application in natural language processing.Word sense tagging consistency would directly affect the quality of corpus,and in turn,it will affect the application of corpus.Due to the complexity and flexibility of the language and the defects of the algorithm,the ecurrent word sense tagging can not be accomplished perfectly by the WSD models,i.e.the WSD results are prone to errors and in consistencies.On the other hand,manual checking is costly in time and investment.On the basis of a survey on the "People Daily" corpus,the sentence similarity computation and the "Hownet",a checking method for the word sense tagging consistency of the corpus of "People daily" is presented in this paper.The experiment result shows the feasibility of the method.

关 键 词:计算机应用 中文信息处理 词义标注 一致性检验 《知网》 语料 语句相似度 

分 类 号:TP391[自动化与计算机技术—计算机应用技术]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象