基于清华汉语树库的有标记联合结构统计分析  被引量:5

Analyzing the Linguistic Features of Coordination with Overt Conjunctions Based on Tsinghua Chinese Treebank

在线阅读下载全文

作  者:王东波[1] 谢靖[1] 

机构地区:[1]南京大学信息管理系,南京210093

出  处:《现代图书情报技术》2010年第4期12-17,共6页New Technology of Library and Information Service

基  金:教育部人文社会科学研究基金资助项目"基于大规模语料库和WordNet词库的英汉学习型词典设计特征知识获取"(项目编号:09YJAZH042);国家社会科学基金项目"汉语词语搭配获取与语义特征分析的相互关系研究"(项目编号:07BYY050)的研究成果之一

摘  要:详细统计和分析有标记联合结构的内部语言学和外部语言学特征。内部特征方面主要考察该结构的词性序列分布、短语序列分布;外部特征方面主要考察该结构的句法功能分布和左右边界特征词。这些考察一方面为从量化的角度研究该结构提供相对精确的数据,另一方面为计算机自动识别该结构提供语言学知识。The article counts and analyzes the internal and external linguistic features of Coordination with Overt Conjunctions (COC) in detail. It mainly investigates the internal linguistic features including the distribution of Part - Of - Speech(POS) and phrases sequences, as well as the external linguistic features including the distribution of syntactic function and the features of border lexicons. For one thing, the statistical data offers the linguistic knowledge for identifying COC, for another thing, the accurate data is used to investigate the COC.

关 键 词:有标记联合结构 内部语言学特征 外部语言学特征 清华汉语树库 

分 类 号:TP391.1[自动化与计算机技术—计算机应用技术]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象