助词“的”用法自动识别研究  被引量:3

Research on Automatic Recognition of Auxiliary “DE”

在线阅读下载全文

作  者:刘秋慧 张坤丽[1] 许鸿飞[1] 俞士汶[2] 昝红英[1] LIU Qiuhui1, ZHANG Kunli1, XU Hongfei1, YU Shiwen2, ZAN Hongying1(1. School of Information Engineering, Zhengzhou University, Zhengzhou 450001; 2. Key Laboratory of Computational Linguistics (MOE), Peking University, Beijing 100871)

机构地区:[1]郑州大学信息工程学院郑州450001 [2]北京大学计算语言学教育部重点实验室,北京100871

出  处:《北京大学学报(自然科学版)》2018年第3期466-474,共9页Acta Scientiarum Naturalium Universitatis Pekinensis

基  金:国家重点基础研究发展计划(2014CB340504); 国家自然科学基金(61402419,60970083); 国家社会科学基金(14BYY096); 计算语言学教育部重点实验室开放课题项目; 河南省科技厅基础研究项目(142300410231,142300410308);河南省科技厅科技攻关项目(172102210478)资助; 河南省教育厅科学技术研究重点项目(15A520098)

摘  要:在"三位一体"虚词用法知识库的基础上,分别采用基于规则、基于CRF模型和神经网络模型的门循环单元,对助词"的"用法进行自动识别,识别的准确率分别为34.4%,77.5%和81.3%。在对助词"的"用法进行分析的基础上,合并了部分用法,并采用CRF模型和神经网络模型进行粗粒度用法识别,准确率分别达到81.8%和84.5%,得到较明显的提高。期望识别结果可以应用于其他自然语言处理任务中。Based on the triune Chinese function word usage knowledge base(CFKB), the rule-based method, CRF(conditional random field) model and GRU(gated recurrent unit) are adopted to automatically recognize the usages of auxiliary "DE", and the accuracy rates are 34.4%, 77.5% and 81.3% respectively. In order to improve the accuracy, some usages of auxiliary "DE" are combined and formed coarse-grained usage. The accuracy of CRF achieves 81.8%, and the accuracy of neural network model achieves 84.5%. It is expected that the recognition result of auxiliary "DE" can improve the performance of other NLP task.

关 键 词:“的” 门循环单元 规则 CRF 

分 类 号:TP391[自动化与计算机技术—计算机应用技术]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象