现代大型机读语料库的标注方法——以CEC政府文件子语料库标注为例  被引量:11

The Annotaion Methods of Mordern Computer Corpora—A Case Study on the Annotation of the Government Document Corpus

在线阅读下载全文

作  者:刘国兵[1] 

机构地区:[1]河南师范大学外国语学院

出  处:《山东外语教学》2008年第5期53-59,共7页Shandong Foreign Language Teaching

基  金:2007年国家社科基金项目“基于语料库的中国英语本土化研究”阶段性成果之一,项目编号:07BYY022

摘  要:语料库标注是实现原始语料机读化的关键环节,也是语料库语言学领域的一个重要研究课题。本文结合国内外有关研究成果以及中国英语语料库建库标注的实践,简要回顾了当前大型机读语料库的标注原则、模式以及标注类型并详细介绍了CEC政府文件子语料库的标注方法,以期对今后中国英语语料库使用者提供帮助,同时也给国内语料库建设者在建库标注方面提供借鉴。Corpus annotation is the key issue in the computerization of the raw data in a large corpus. It is also one of the important fields of corpus linguistic research. Based on the research achievements and the annotating practices of English corpus compilation in China, this study mainly introduces and discusses the annotation principle, annotation mode and the annotation type of the China English Corpus and provides a detailed introduction to the annotation methods of the government document corpus, one of the minor - corpus of CEC. The aim of this research is to provide help to the corpus users and give some annotation references to the corpus compilers in China.

关 键 词:中国英语语料库 政府文件 标注 

分 类 号:H030[语言文字—语言学]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象