基于核心句及句法关系的评价对象抽取  被引量:22

Comment Target Extraction Based on Nuclear Sentences and Syntactic Relations

在线阅读下载全文

作  者:张莉[1,2] 钱玲飞[1] 许鑫[3] 

机构地区:[1]南京大学信息管理系,江苏南京210008 [2]南京大学计算机科学与技术系国家重点实验室,江苏南京210008 [3]华东师范大学商学院信息学系,上海200241

出  处:《中文信息学报》2011年第3期23-29,共7页Journal of Chinese Information Processing

基  金:教育部人文社会科学重点研究基地基金资助项目(08JJD870225);江苏省自然科学基金资助项目(BK2009233)

摘  要:意见挖掘已成为近年来的热点问题,该文针对COAE2009评测中的意见挖掘任务的一项子任务——评价对象抽取进行了研究。首先提出利用核心句进行学习的思想,继而确定了10种句法关系作为语言特征,将原始句和核心句分别基于词、词性和句法关系利用条件随机场模型进行学习和比较,在后期又利用二次学习的方式进一步提高了抽取性能。实验取得了相对不错的抽取效果,证明我们提出的方法是可行的,且具有一定的应用价值。Opinion mining has become a hot topic in recent years.We focus on one of the sub-tasks of opinion mining in COAE2009 and propose a theory of learning from nuclear sentences.Ten types of syntactic relations are defined as features,and the Conditional Random Fields(CRF) model is applied to analyze and compare the original sentence against the nuclear sentence in terms of words,part-of-speech(POS) and syntactic relations.Thenthe CRFs re-learning is carried out to further enhance the extraction performance.Experiment result exhibits measurable improvement and therefore proves the feasibility and value of this method.

关 键 词:意见挖掘 评价对象抽取 核心句 句法关系 条件随机场 

分 类 号:TP391[自动化与计算机技术—计算机应用技术]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象