基于最大熵的依存句法分析  被引量:11

Dependency Parsing Based on Maximum Entropy Model

在线阅读下载全文

作  者:辛霄[1] 范士喜[1] 王轩[1] 王晓龙[1] 

机构地区:[1]哈尔滨工业大学深圳研究生院智能计算研究中心,广东深圳518055

出  处:《中文信息学报》2009年第2期18-22,共5页Journal of Chinese Information Processing

基  金:自然科学基金资助项目(60435020;90612005);国家863高科技计划资助项目(2006AA01Z197)

摘  要:该文提出并比较了三种基于最大熵模型的依存句法分析算法,其中最大生成树(MST)算法取得了最好的效果。MST算法的目标是在一个带有权重的有向图中寻找一棵最大的生成树。有向图的每条边都对应于一个句法依存关系,边的权重通过最大熵模型获得。训练和测试数据来源于CoNLL2008 Share Task的公用语料。预测的F1值在WSJ和Brown两个测试集上分别达到87.42%和80.8%,在参加评测单位中排名第6。This paper presents three algorithms for dependency parsing based on the Maximum Entropy Models. The Maximum Spanning Tree (MST) algorithm achieves the best result. The target of MST is to find a Maximum Spanning Tree in a directed graph. Each edge of the directed graph corresponds to a dependency relation of the dependency parser, and the weights of the edges are obtained by using a Maximum Entropy Model. The training and test data sets are the CoNLL2008 share task corpora. The system achieves F1 scores of 87.42 and 80.8 for WSJ and Brown test data respectively, ranking sixth among all the competition teams.

关 键 词:计算机应用 中文信息处理 句法分析 最大生成树 最大熵 

分 类 号:TP391[自动化与计算机技术—计算机应用技术]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象