基于语块和条件随机场(CRFs)的韵律短语识别  被引量:6

Identification of Chinese Prosodic Phrase Based on Chunk and CRF

在线阅读下载全文

作  者:钱揖丽[1,2] 冯志茹[1] 

机构地区:[1]山西大学计算机与信息技术学院,山西太原030006 [2]山西大学计算智能与中文信息处理教育部重点实验室,山西太原030006

出  处:《中文信息学报》2014年第5期32-38,共7页Journal of Chinese Information Processing

基  金:国家自然科学青年基金(61005053;61100138);山西省青年科技研究基金(2012021012-1);山西省高校科技开发项目(20091001);山西省自然科学基金(2011011016-2);山西省回国留学人员科研资助项目(2013-022)

摘  要:该文提出一种基于汉语语块这一浅层句法信息,并利用条件随机场模型的中文文本韵律短语边界预测方法。首先介绍语块的定义和标注算法,然后在进行了语块结构标注以及归并处理的语料上,利用CRFs算法生成相应模型对韵律短语进行识别。实验结果表明,基于语块信息的CRFs韵律短语识别模型的识别效果优于不利用语块结构的模型,其F值平均能够提高约十个百分点。This paper proposes a Chinese prosodic phrase prediction method is proposed based on CRF model over Chinese Chunk which reflects shallow syntactic information. The Chunk definition and its tagging algorithm is first described, and thenthe CRF is applied over the Chunk annotated corpus to predict prosodic phrase boundary. The experimental results show that, after labeling the structure of Chunk, the F-sore of the CRFs model for prosodic phrase identification increases nearly l0%.

关 键 词:韵律短语 边界预测 语块结构 条件随机场 

分 类 号:TP391[自动化与计算机技术—计算机应用技术]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象