融合词义信息的中文短语句法分析  被引量:1

Chinese phrase parsing with semantic information

在线阅读下载全文

作  者:耿立飞 李红莲[1] 吕学强[2] 吴云芳[3] 

机构地区:[1]北京信息科技大学信息与通信工程学院,北京100101 [2]网络文化与数字传播北京市重点实验室(北京信息科技大学),北京100101 [3]北京大学计算语言学研究所,北京100871

出  处:《计算机应用》2014年第4期1109-1113,1154,共6页journal of Computer Applications

基  金:国家自然科学基金资助项目(61171159;61271304);北京市教委科技发展计划重点项目暨北京市自然科学基金B类重点项目(KZ201311232037);北京信息科技大学网络文化与数字传播北京市重点实验室开放课题项目(ICDD201203)

摘  要:针对目前融合词义信息的短语句法分析过程中,多义词词义消歧较差的问题,提出一种基于词性消歧的中文短语句法分析方法。首先构建具有词性信息的同义词字典;然后对训练集和测试集中的词语进行词义替换,利用多义词的词性区分其不同的词义。在宾州中文树库(CTB)的实验结果表明,正确率为80.30%,召回率为78.12%,F值为79.19%。相对于没有进行词性消歧的系统,该方法有效提高了短语句法分析的性能。To deal with the poor performance of word sense disambiguation in parsing,a Chinese phrase parsing approach was proposed based on disambiguation of Chinese part of speech.First,it expanded part of speech of TongYiCi CiLin and then substituted the original words in the training set and test set with semantics codes.In this process,it used part of speech of word for word sense disambiguation.The experimental results on Penn Chinese TreeBank (CTB) show that the proposed method achieves precision rate of 80.30%,recall rate of 78.12%,and F-measure of 79.19%.Relative to the no disambiguation system,the presented approach can effectively improve the performance of phrase parsing.

关 键 词:汉语句法分析 同义词词林 知网 一词多义 词义消歧 

分 类 号:TP18[自动化与计算机技术—控制理论与控制工程]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象