检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
作 者:王萌[1] 俞士汶[1] 段慧明[1] 孙薇薇[1]
出 处:《中文信息学报》2008年第5期22-29,38,共9页Journal of Chinese Information Processing
基 金:国家973课题资助项目(2004CB318102)
摘 要:以《现代汉语语法信息词典》中语法属性的概率化描述为目标,基于1998年上半年《人民日报》标注语料,对名词语法属性的概率化进行了初步的实验研究。首先,考察了名词与数词、名词与量词搭配的相关属性,引进"分散度"概念,利用它对"数名"结构进行了定量分析;其次,考察了名词受不同量词修饰的分布情况。最后,把实验结果与《现代汉语语法信息词典》的相应属性进行了比照和分析,在属性概率化的同时也对其正确性进行了验证。This paper introduces the preliminary research on probabilistic grammatical characteristics of noun in contemporary Chinese based on the POS tagged corpus of People Daily. The grammatical characteristics which show the relationship between numeral, classifier and noun are firstly discussed. The conception of "Distribution Degree" is proposed to analyze the "Numeral-Noun" structure quantitatively. Also, the distribution of classifiers which can collocate with a certain noun is investigated. Finally, the experimental results are compared with the original attribute values in the Grammatical Knowledge-base of Contemporary Chinese, and the correctness of the dictionary is verified.
关 键 词:计算机应用 中文信息处理 现代汉语 现代汉语语法信息词典 概率语法属性描述 基本标注语料库 “数名”结构 “数量名”短语
分 类 号:TP391[自动化与计算机技术—计算机应用技术]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:216.73.216.4