中文词语倾向性分析处理  被引量:5

Semantic orientation identification for Chinese opinion terms

在线阅读下载全文

作  者:李娟[1,2] 张全[2] 贾宁[1,2] 

机构地区:[1]中国科学院研究生院,北京100039 [2]中国科学院声学研究所,北京106190

出  处:《计算机工程与应用》2009年第2期131-133,共3页Computer Engineering and Applications

基  金:国家重点基础研究发展规划(973)No.2004CB318104;中科院声学所知识创新工程项目(No.0654091431);中国科学院声学研究所“所长择优基金”(No.GS13SJJ04);中国科学院青年人才领域前沿项目(No.O754021432)~~

摘  要:意见挖掘是自然语言处理研究领域的一个新热点。词语倾向性的判定是意见挖掘的基础和重要环节。该文进行了中文词语倾向性的自动判定实验。实验中采用了《现代汉语褒贬用法词典》中的词语做为褒贬判定的核心词汇,以同义词词典扩展了褒贬义词典的词语,并使用二元语法模型来判定多倾向性词语的倾向。实验结果褒义词的F-Score为79.31%,贬义词的F-Score为78.18%。Opinion mining is a new hotspot in the area of natural language processing.Determining the opinion orientation of the glossary is a foundation and very important component in an opinion mining system.An experiment is carried out on opinion orientation identifying for Chinese opinion terms.In the experiment,the authors take the words which are in COMTEMPORARY CHINESE LANGUAGE ORIENTATION USAGE DICTIONARY as the seed words,and extend them by synonyms dictionary.Further more,Bigram theory is adopted to disambiguate the multi-orientation for one word.The F-score of the experiment reaches 79.31% for positive words and 78.18% for negative words.

关 键 词:意见挖掘 词语倾向 二元语法 

分 类 号:H087[语言文字—语言学]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象