检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
机构地区:[1]北京大学中文系北京大学中国语言学研究中心,北京100871
出 处:《云南民族大学学报(哲学社会科学版)》2012年第5期121-126,共6页Journal of Yunnan Minzu University(Philosophy and Social Sciences Edition)
基 金:教育部人文社会科学重点研究基地重大项目"基于系统语音对应的核心词分阶及建模研究"(项目编号:11JJD740004);韩国:POSCO TJ Park Foudantion;四川省凉山彝族自治州社科联项目"彝语文本解读和华夏文明起源研究"阶段成果
摘 要:核心词分阶是判定同源关系的必要步骤。基于大规模语音对应数据库,我们提出并讨论一种算法模型,该模型计算核心词的核心程度,自动调整高阶核心词集和低阶核心词集,使得两阶词集在已知为同源关系的语言中,其分布与已知为接触关系的语言显著不同,即通过算法调整核心词集,使得有阶分布的显著性增加。这个算法模型的基本思路分为两个密切相关的部分:核心程度算法和两阶核心词调整算法。This research, based on a large database of sound correspondence among languages in China, aims at proposing an algorithm model to work out the importance of each basic word, and then adjust the basic word between the high - rank set and the low - rank set automatically. The result will be that when the languages in question are genetically related, the distribution of basic words in the two sets differs obviously from that when the languages in question are in contact relationship. That is, through the algorithm of adjusting the two set of basic words, the obviousness of ranking will increase. This algorithm model can be divided into two interrelated parts: counting to what degree a word being basic, and adjusting the word between high - rank set and low - rank set.
关 键 词:语源关系 核心词 自动分阶 算法模型 玛丽玛萨话
分 类 号:H257[语言文字—少数民族语言]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:216.73.216.7