基于条件随机场的兼语结构自动识别  被引量:5

Automatic Identification of Concurrent Structure Based on Conditional Random Field

在线阅读下载全文

作  者:陈静[1,2] 王东波[1] 谢靖[1] 郑建明[1] 

机构地区:[1]南京大学信息管理系,江苏南京210093 [2]南京医科大学图书馆,江苏南京210029

出  处:《情报科学》2012年第3期439-443,共5页Information Science

基  金:2010年国家社科基金(10BTQ005);国家863项目(2009AA01A339);南京大学研究生科研创新基金资助项目(2010CW02)

摘  要:本文研究对象为汉语中较为复杂的兼语结构,通过对大规模语料中兼语结构的分布观察,进行其内部语言特征及外部语言特征分析;一是从定量角度对其结构研究提供数据支持,二是为计算机自动识别提供语言学支持。基于这些特征建立模板,从而构建条件随机场模型,对兼语结构进行自动识别。在开放训练中,F值最高可达85.71%,这个结果表明条件随机场在兼语结构识别中已经接近应用水平,可以作为兼语结构识别的有效方法。In this investigation the paper uses Condi-tional Random Field(CRF) for automatic identification of Concurrent Structure in Chinese Infor-mation Processing.We explores the distribution of Concurrent Structure in Tsinghua University 973 Treebank and analyze the internal and external linguistic features of the structure.A condi-tional random field model is built using these features.In open test,the best F value reaches 85.71% and this result shows that CRF is an effective method for automatic identification of Concurrent structure.

关 键 词:兼语结构 条件随机场 自动识别 中文信息处理 特征模板 

分 类 号:G350[文化科学—情报学] TP311[自动化与计算机技术—计算机软件与理论]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象