汉语基本短语的自动识别  被引量:41

Automatic Identification of Chinese Base Phrases

在线阅读下载全文

作  者:张昱琪[1] 周强[1] 

机构地区:[1]智能技术与系统国家重点实验室,清华大学计算机系北京100084

出  处:《中文信息学报》2002年第6期1-8,共8页Journal of Chinese Information Processing

基  金:国家自然科学基金项目 (6 990 30 0 7) ;国家 973基金项目 (G19980 30 5 0 7) ;国家 86 3计划项目 (2 0 0 1AA114 0 4 0 )

摘  要:本文应用基于实例的MBL(Memory BasedLearning)学习方法 ,对汉语中较常见的 9种基本短语的边界及类别进行识别 ,并利用短语内部构成结构和词汇信息对预测中出现的边界歧义和短语类型歧义进行了排歧处理。实验中还比较了在特征向量中加入词汇信息与否对实验结果的影响。实验取得了比较令人满意的结果 :对这 9种基本短语的识别正确率达到 95 .2 % ;召回率达到 93.7%。This paper proposed a hybrid model to identify Chinese base phrases.At first step,We use a memory based learning (MBL) approach to the chunking of nine types of Chinese base phrases and compare the results coming from different feature vectors.In the second series of experiments we used grammar rules that represent the inner structures of base phrases and lexical information to correct the incorrect predictions from the first step.The experiments reported in this paper show competitive results:the precision is 95.2% and the recall is 93.7%.

关 键 词:部分分析 基本短语 实例学习 短语结构 词汇排放 短语识别 自然语言处理 汉语句法分析 

分 类 号:TP391.12[自动化与计算机技术—计算机应用技术]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象