试论中古汉语语料库佛教文献分词规范  被引量:2

Standard in word segmentation for Buddhist works in the Middle Chinese Corpus

在线阅读下载全文

作  者:化振红[1] HUA Zhen-hong

机构地区:[1]南京师范大学文学院,江苏南京210097

出  处:《东南大学学报(哲学社会科学版)》2019年第1期135-142,145,共9页Journal of Southeast University(Philosophy and Social Science)

基  金:国家社科基金重大招标项目"汉语史语料库建设研究"(10&ZD117);江苏高校优势学科建设工程资助项目(PAPD)阶段性成果

摘  要:在国家标准《信息处理用现代汉语分词规范》基础上,兼顾中古词汇的过渡性、佛教文献的特殊性、人工分词的操作性、分词软件识别的便利性等多方面因素,讨论了中古汉语语料库佛教文献的词语切分问题,建立了针对中古佛教文献的分词规范:以分词单位作为中古汉语语料库的基本单位;判定分词单位适当从严;依据意义标准、频率标准、语感标准界定词与非词;如何切分佛教文献中的外来词、同义复词、多音节词、专有名词,以及动补结构的词语、过渡性质的词语。Based on the Standardization of Word Segmentation for Modern Chinese for Computational Uses,we establish rules about word segmentation for Buddhist works in the Middle Chinese Corpus.The rules are about the basic unit,strict standards for word units,difference between words and phrases in terms of significance,frequency and language sense,and about how to cut loan words,synonymous compound words,multi-syllable words and proper nouns.

关 键 词:中古汉语 佛教文献 语料库 动态义项库 词语切分 

分 类 号:H13[语言文字—汉语]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象