汉语缩略语自动处理研究现状  被引量:7

Survey:Abbreviation Processing in Chinese Text

在线阅读下载全文

作  者:王厚峰[1,2] 

机构地区:[1]北京大学信息科学技术学院,北京100871 [2]北京大学计算语言学教育部重点实验室,北京100871

出  处:《中文信息学报》2011年第5期60-67,82,共9页Journal of Chinese Information Processing

基  金:国家自然科学基金资助项目(60973053;91024009);高校博士点专项基金资助项目(20090001110047)

摘  要:缩略语是自然语言中广泛使用的一类典型语言单元,也是最主要的新词来源。而新词会造成自然语言处理多个层面的困难。该文分析了汉语缩略语的特点,对汉语缩略语的构成形式作了总结,对汉语缩略语处理的问题作了划分,并针对不同的问题,重点介绍了在汉语中的研究现状;之后简要比较了汉语缩略语与英语缩略语的差异,并对英语缩略语处理的一些典型方法作了分析。Abbreviation is a typical kind of language unit widely occuring in natural languages and contributes most OOVs which cause big difficulties for Natural Language Processing at different levels.This paper firstly makes a survey of properties and construction form of Chinese abbreviation;then classifies Chinese abbreviation problems into four aspects and sums up the related works for each one;finally investigates English abbreviation processing and compares some differences on abbreviation between in Chinese and in English.

关 键 词:缩略语识别 缩略语扩展 缩略语预测 缩略语挖掘 

分 类 号:TP391[自动化与计算机技术—计算机应用技术]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象