篇际零重复词分布和增长模式实证研究  被引量:5

The Distribution and Growth Model of Inter-textual Hapax Legomena

在线阅读下载全文

作  者:罗卫华[1] 佟大明[1] 

机构地区:[1]大连海事大学

出  处:《中国外语》2011年第6期53-58,87,共7页Foreign Languages in China

基  金:2010年度国家社科基金项目"英语篇际词汇覆盖模式与词汇教学研究"(10BYY042)的部分研究成果

摘  要:本文研究篇际零重复词的分布及其增长模式。本实证性研究中的零重复词随机抽取于2 000篇样本,每篇样本为1 000词,均取自于1亿单词的英国国家语料库(BNC)。研究结果表明篇际长度为1 000词的文本中零重复词与词汇量之间的比率为大约0.66。当文本长度增加到100万字时,零重复词和词汇量之间的比率约为0.38。零重复词的数量在长度相同的文本中呈正态分布,并且与词汇量成线性关系。篇际中零重复词的增长模式可以用幂函数模型来描述,此幂函数模型与所观察的零重复词的增长曲线有很好的拟合。零重复词的这种分布特点是影响中国英语学习者词汇习得的主要因素之一。This empirical study examines the inter-textual distribution of hapax legomena and their growth patterns from the angle of EFL teaching.The hapax legomena were extracted from 2000 1000-word samples randomly drawn from the one-billion word British National Corpus(the BNC).The result shows that the hapax/vocabulary ratio of texts about 1000 word in length is about 0.66.As the text size increases to 1,000,000,the ratio is 0.38.Hapax legomena have a normal distribution across texts of equal size,and they have a linear relationship with the size of vocabulary.The inter-textual hapax legomenon growth pattern can be described with the power model,which provides a reasonably good fit to the observed hapax legomenon growth curves.This distributional characteristics is one of the factors influencing the vocabulary acquisition of Chinese EFL learners.

关 键 词:零重复词 篇际词汇增长 幂函数模型 

分 类 号:H030[语言文字—语言学]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象