检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
机构地区:[1]南京大学信息管理系,江苏南京210008 [2]南京大学计算机科学与技术系国家重点实验室,江苏南京210008 [3]华东师范大学商学院信息学系,上海200241
出 处:《中文信息学报》2011年第3期23-29,共7页Journal of Chinese Information Processing
基 金:教育部人文社会科学重点研究基地基金资助项目(08JJD870225);江苏省自然科学基金资助项目(BK2009233)
摘 要:意见挖掘已成为近年来的热点问题,该文针对COAE2009评测中的意见挖掘任务的一项子任务——评价对象抽取进行了研究。首先提出利用核心句进行学习的思想,继而确定了10种句法关系作为语言特征,将原始句和核心句分别基于词、词性和句法关系利用条件随机场模型进行学习和比较,在后期又利用二次学习的方式进一步提高了抽取性能。实验取得了相对不错的抽取效果,证明我们提出的方法是可行的,且具有一定的应用价值。Opinion mining has become a hot topic in recent years.We focus on one of the sub-tasks of opinion mining in COAE2009 and propose a theory of learning from nuclear sentences.Ten types of syntactic relations are defined as features,and the Conditional Random Fields(CRF) model is applied to analyze and compare the original sentence against the nuclear sentence in terms of words,part-of-speech(POS) and syntactic relations.Thenthe CRFs re-learning is carried out to further enhance the extraction performance.Experiment result exhibits measurable improvement and therefore proves the feasibility and value of this method.
关 键 词:意见挖掘 评价对象抽取 核心句 句法关系 条件随机场
分 类 号:TP391[自动化与计算机技术—计算机应用技术]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:216.73.216.143