检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
作 者:化振红[1] HUA Zhen-hong
出 处:《东南大学学报(哲学社会科学版)》2019年第1期135-142,145,共9页Journal of Southeast University(Philosophy and Social Science)
基 金:国家社科基金重大招标项目"汉语史语料库建设研究"(10&ZD117);江苏高校优势学科建设工程资助项目(PAPD)阶段性成果
摘 要:在国家标准《信息处理用现代汉语分词规范》基础上,兼顾中古词汇的过渡性、佛教文献的特殊性、人工分词的操作性、分词软件识别的便利性等多方面因素,讨论了中古汉语语料库佛教文献的词语切分问题,建立了针对中古佛教文献的分词规范:以分词单位作为中古汉语语料库的基本单位;判定分词单位适当从严;依据意义标准、频率标准、语感标准界定词与非词;如何切分佛教文献中的外来词、同义复词、多音节词、专有名词,以及动补结构的词语、过渡性质的词语。Based on the Standardization of Word Segmentation for Modern Chinese for Computational Uses,we establish rules about word segmentation for Buddhist works in the Middle Chinese Corpus.The rules are about the basic unit,strict standards for word units,difference between words and phrases in terms of significance,frequency and language sense,and about how to cut loan words,synonymous compound words,multi-syllable words and proper nouns.
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:3.145.180.66