汉语二语教学领域词义标注语料库的研究及构建  被引量:2

A Word Sense Annotated Corpus for Teaching Chinese as Second Language

在线阅读下载全文

作  者:王敬[1] 杨丽姣[1] 蒋宏飞[1] 苏靖杰 付静玲 

机构地区:[1]北京师范大学中文信息处理研究所,北京100875

出  处:《中文信息学报》2017年第1期221-229,共9页Journal of Chinese Information Processing

基  金:国家语委"十二五"科研规划项目(YB125-124);国家高技术研究发展计划(863)(NO.2012AA011104);中国博士后科学基金第53批面上资助(一等)(2013M530026)

摘  要:词汇教学在汉语二语教学领域占有极为重要的地位,其中多义词又是词汇教学的重点和难点。该研究通过分析三部经典领域词表,选取了1 181个重点多义词,以《现代汉语词典(第6版)》为标注体系,制定了适合实际标注的多义词标注规范和形式,在197册经典汉语二语教材上进行了多义词词义标注,构建了一个规模约350万字的面向汉语二语教学领域的词义标注语料库,并在此基础上对1 811个多义词、4 323个多义词义项进行了计量统计,分析了多义词不同词义的出现情况及其分布规律。为了更好地服务于汉语二语教学,开发了语料库检索系统,设计并实现了多义词义项的查询功能。In field of teaching Chinese as a second language, the teaching of word is very important, in which polysemous word is a challenging issue. After a survey of 3 classical vocabularies in this field, this paper selects 1 181 polysemous words. Then an annotation specification is designed, with a reference to Modern Chinese Dictionary (Edition 6). Tagging the 1 181 words appeared in 197 popular Chinese textbooks yields a corpus with word senense annotation over 3.5 million characters. A quantitative study on the 1 811 polysemous words is also made, with an analysis of the distribution of total 4 323 word senses.

关 键 词:汉语二语教学 语料库 多义词标注 

分 类 号:TP391[自动化与计算机技术—计算机应用技术]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象