现代汉语名词语法属性的计量研究初探  被引量:2

Quantitative Research on Grammatical Characteristics of Noun in Contemporary Chinese

在线阅读下载全文

作  者:王萌[1] 俞士汶[1] 段慧明[1] 孙薇薇[1] 

机构地区:[1]北京大学计算语言学研究所,北京100871

出  处:《中文信息学报》2008年第5期22-29,38,共9页Journal of Chinese Information Processing

基  金:国家973课题资助项目(2004CB318102)

摘  要:以《现代汉语语法信息词典》中语法属性的概率化描述为目标,基于1998年上半年《人民日报》标注语料,对名词语法属性的概率化进行了初步的实验研究。首先,考察了名词与数词、名词与量词搭配的相关属性,引进"分散度"概念,利用它对"数名"结构进行了定量分析;其次,考察了名词受不同量词修饰的分布情况。最后,把实验结果与《现代汉语语法信息词典》的相应属性进行了比照和分析,在属性概率化的同时也对其正确性进行了验证。This paper introduces the preliminary research on probabilistic grammatical characteristics of noun in contemporary Chinese based on the POS tagged corpus of People Daily. The grammatical characteristics which show the relationship between numeral, classifier and noun are firstly discussed. The conception of "Distribution Degree" is proposed to analyze the "Numeral-Noun" structure quantitatively. Also, the distribution of classifiers which can collocate with a certain noun is investigated. Finally, the experimental results are compared with the original attribute values in the Grammatical Knowledge-base of Contemporary Chinese, and the correctness of the dictionary is verified.

关 键 词:计算机应用 中文信息处理 现代汉语 现代汉语语法信息词典 概率语法属性描述 基本标注语料库 “数名”结构 “数量名”短语 

分 类 号:TP391[自动化与计算机技术—计算机应用技术]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象