现代汉语缩略语自动识别的方法研究  被引量:8

Research methods about automatic identification of modern Chinese abbreviation

在线阅读下载全文

作  者:武子英[1,2] 郑家恒[2,3] 

机构地区:[1]忻州师范学院,山西忻州034000 [2]山西大学计算机与信息技术学院,山西太原030006 [3]计算智能与中文信息处理省部共建教育部重点实验室

出  处:《计算机工程与设计》2007年第16期4052-4054,共3页Computer Engineering and Design

基  金:国家自然科学基金项目(60473139);山西省自然科学基金项目(20051034);山西大学青年基金项目(2006011)

摘  要:在中文信息处理领域,缩略语识别是研究中很重要的一个方面。针对缩略语词典资源稀少的现状,提出一种在生语料中自动抽取现代汉语缩略语的方法。首先获取候选缩略语的源短语候选集,然后利用基于上下文的源短语与缩略语配对方法,可自动生成一部缩略语词典,实验结果证明,该方法是一种相对"智能"的方法。Identification of modem Chinese abbreviation is a very important study in Chinese information processing. Because of being short of abbreviation dictionary now, an approach is proposed, which would realize the automatic identification of modem Chinese ab- breviation. First abbreviation candidate is gained, then the abbreviation dictionary is automatically produced based on the context. The experiment show the approach is a relatively "smart" approach.

关 键 词:源短语 缩略语 上下文 余弦相似度 未登录词 

分 类 号:TP391[自动化与计算机技术—计算机应用技术]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象