正则表达式在汉语语料检索中的应用  被引量:10

Using Regular Expressions in Chinese Corpus Search

在线阅读下载全文

作  者:秦洪武[1] 王克非[2] 

机构地区:[1]曲阜师范大学外国语学院,山东曲阜273165 [2]北京外国语大学中国外语教育研究中心,北京100089

出  处:《外国语文》2013年第6期74-79,共6页Foreign Languages and Literature

基  金:国家社科基金重大项目"大规模英汉平行语料库的建立与加工"(10&ZD127);国家社科基金课题"历时语料类比中的翻译与现代汉语互动研究"(10BYY008)的阶段性基础研究成果

摘  要:正则表达式能充分描述检索的条件,实现语言数据的精确提取。本文探讨正则表达式用于汉语语料检索的问题,分析了汉语元字符使用的特殊性,提出了反映汉语词汇和语法特点的表达式编写方法,并以实例展示了正则表达式在汉语语料检索时的使用效果。Regular expression (regex for short) can specify retrieval conditions with precision for concise matching of strings in a given corpus. Much research has contributed to the use of regex to search for English corpus, however, little is done to use regex in Chinese data retrieval. This paper focuses on the use of metacharacters particular to Mandarin Chinese, and attempts to work out query patterns operable for the matching of strings in Chinese texts.

关 键 词:语料库 正则表达式 元字符 数据检索 

分 类 号:H313[语言文字—英语]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象