四种基本统计句法分析模型在汉语句法分析中的性能比较  被引量:10

A Comparative Study of Four Primary Statistical Models in Chinese Parsing

在线阅读下载全文

作  者:孟遥[1] 李生[1] 赵铁军[1] 曹海龙[1] 

机构地区:[1]哈尔滨工业大学计算机科学与技术学院,黑龙江哈尔滨150001

出  处:《中文信息学报》2003年第3期1-8,共8页Journal of Chinese Information Processing

基  金:国家自然科学基金资助项目 ( 69775 0 17);国家"八六三"高技术研究发展计划基金资助项目( 863- 30 6- 12 0 0 1AA11410 1)

摘  要:统计模型的选择是统计句法分析的关键。目前句法分析常用的有四种经典统计模型—PCFG模型 ,基于历史模型、分层渐近式模型和头驱动模型。本文通过实验 ,在已有的 10 0 0 0句汉语树库基础上 ,测试了这四种经典模型在现有数据规模下各自的性能 ,并论述了这四种经典模型的各自特点。本文旨在通过对四种基本模型的比较研究 ,为具体应用中句法分析模型的选择提供参考和依据。Choosing the statistical model is the key problem in statistical parsing. Statistical model lies in the core of NLP parsing. This paper investigates 4 primary statistical parsing models, namely PCFG, history-based model, cascading parsing model and head-driven parsing model, and compares their performances in a 10000 Chinese treebank. The analysis based on the experiment were shown in the paper. The comparative study of these models can be exploited to build the practical and effective Chinese parser.

关 键 词:计算机应用 中文信息处理 统计句法分析 基本模型 汉语分析 

分 类 号:TP391[自动化与计算机技术—计算机应用技术]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象