基于规则的现代汉语常用助词用法自动识别  被引量:6

Automatic annotation of auxiliary words usage in rule-based Chinese language

在线阅读下载全文

作  者:韩英杰[1] 昝红英[1] 张坤丽[1] 柴玉梅[1] 

机构地区:[1]郑州大学信息工程学院,郑州450001

出  处:《计算机应用》2011年第12期3271-3274,共4页journal of Computer Applications

基  金:国家自然科学基金资助项目(60970083);北京大学计算语言学教育部重点实验室开放课题基金资助项目(KLCL-1004);河南省科技创新人才杰出青年基金资助项目(104100510026)

摘  要:目前已有的助词研究成果很难直接应用于自然语言处理的机器识别。在现代汉语词典、规则库、语料库"三位一体"的助词知识库基础上,采用基于规则的方法进行了现代汉语常用助词用法的自动识别。对比规则优化前后的实验结果证明,对用法的规则进行细化、扩充和调序可以有效地提高助词用法识别的准确率和召回率,减轻人工标注的工作量,提高大规模语料库的质量。The existing results of auxiliary word can hardly be used in the automatic annotation of natural language processing.Based on the auxiliary words knowledge database which consists of dictionaries,rule base and corpus base,the rule-based method was used in automatic annotation of auxiliary words usage.The experimental result shows that refining,extending and adjusting the matching order of the rules can promote the precision and recall effectively.It is also helpful to improve the quality of Chinese corpus,deepen the processing depth,and reduce the artificial work.

关 键 词:助词 知识库 用法 规则 自动识别 

分 类 号:TP399[自动化与计算机技术—计算机应用技术]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象