第三届中文倾向性分析评测(COAE2011)语料的构建与分析  被引量:6

Construction and Analysis of the third Chinese Opinion Analysis Evaluation(COAE2011) Corpus

在线阅读下载全文

作  者:廖祥文[1] 许洪波[2] 孙乐[3] 姚天昉[4] 

机构地区:[1]福州大学数学与计算机科学学院,福建福州350108 [2]中国科学院计算技术研究所,北京100190 [3]中国科学院软件研究所,北京100190 [4]上海交通大学,上海200240

出  处:《中文信息学报》2013年第1期56-63,共8页Journal of Chinese Information Processing

基  金:福建省自然科学基金资助项目(2010J05133);福建省科技创新平台计划项目(2009J1007);国家自然科学基金重点课题(60933005);国家自然科学基金课题(61173064;90920010)

摘  要:文本倾向性分析已成为自然语言处理领域研究的热点问题之一。为进一步推动中文倾向性分析的研究,中国中文信息学会信息检索专业委员会举办了第三届中文倾向性分析评测(COAE2011)。该次评测主要关注领域和上下文语境(Context)对中文倾向性分析的影响。该文主要介绍COAE2011评测语料的构建及其对评测的支撑:首先介绍了COAE2011语料的领域选取、媒介分布等获取过程,然后详细阐述语料的标注原则与方法,最后依据评测结果分析领域和上下文语境因素对倾向性的影响。COAE2011语料的建立将为中文倾向性分析提供强大的资源支持。Opinion mining is a hot topic of nature langue processing. In order to promote Chinese opinion mining re search, the Technical Committee of Information Retrieval in Chinese Information Processing of China holds the third Chinese Opinion Analysis Evaluation Conference (COAE2011). The conference focuses on the influence of domain and context on Chinese opinion analysis. The paper presents the construction of COAE2011 corpus and how the cor pus works in the evaluation: it firstly introduces the course of corpus construction, such as the distrihution of do main and media; then it discusses in detail the tagging criterion and method of corpus; finally, the impact of domain and context on Chinese opinion mining is evaluated based on the results of submitted runs. The COAE2011 corpus provides strong support for Chinese opinion analysis.

关 键 词:中文信息处理 倾向性分析 倾向性语料库 文本编码规范 

分 类 号:TP391[自动化与计算机技术—计算机应用技术]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象