语料库中语块提取的工具与方法  被引量:15

Methods and Tools of Retrieving Lexical Chunks from Corpora

在线阅读下载全文

作  者:詹宏伟[1] 

机构地区:[1]杭州师范大学外国语学院,浙江杭州310036

出  处:《外语教学》2011年第2期23-26,共4页Foreign Language Education

基  金:浙江省社科规划重点项目(10CGWW02ZQ)"基于语料库的EFL构式习得研究";浙江省教育科学规划研究课题(SC37)

摘  要:在自然语言处理领域,语言检索的工具和技术进展很快。语块识别的技术也从人工识别进入了机器识别。语块检索技术的起点是从语料库中提取连续的、固定的词串,经过几年的发展,已逐步达到了其高级阶段:提取非连续的可变的语块。本文从语料库研究的角度,分别从连续的语块和非连续的语块两个方面,对英语的语块识别与检索技术和工具进行归纳和评述。In natural language processing, the tools and techniques of concordancing have developed very quickly, from manual identification to automatic identification. In the earlier stage, only continuous and fixed word strings were retrieved from corpora. A few years later, the technology has become more sophisticated, i.e. retrieving discontinuous and variable chunks. This paper sums up the methods of retrieving lexical chunks from corpora, with special focus on the identification of continuous and discontinuous chunks.

关 键 词:语块 检索 语料库 

分 类 号:H030[语言文字—语言学]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象