检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
机构地区:[1]合肥工业大学管理学院,合肥230009 [2]过程优化与智能决策教育部重点实验室,合肥230009
出 处:《计算机应用研究》2014年第11期3333-3336,共4页Application Research of Computers
基 金:国家"973"计划资助项目(2013CB329600);国家自然科学基金资助项目(71071047);国家教育部人文社会科学研究项目(12YJC630073);合肥工业大学博士专项科研基金资助项目(2012HGBZ0661)
摘 要:为了研究同义特征词的规律及其对情感分析的影响,基于大规模语料库的统计学习方法,发现如果将每一个特征词的所有同义特征词组成特征词组,词组中的同义特征词按照自身在语料库中出现的频率从大到小排列,那么同义特征词在词组中出现的频率与该词在词组中的名次存在幂函数关系:y=β0xβ1。将特征代表词的同义特征词所对应的情感词加入到该特征代表词的情感词集中,可以有效提高特征代表词的情感分析的准确性。In order to study the law of domain synonymous feature-words and its influence on sentiment analysis,this paper based on statistical learning method of the large-scale corpus and found that if all the synonymous feature-words of each feature-word formed phrases where the synonymous feature-words of each phrase rank according to their frequency in the corpus from high to low,there existed a power function among the frequencies of the synonymous feature-word and the ranking of the synon-ymous feature-word in the phrase:y=β0 x^β1 .Moreover,this paper show that adding the emotional words of the synonymous fea-ture-words of the rep feature-word to the emotional word-set of the rep feature-word can effectively improve the accuracy of the sentiment analysis of the rep feature-word.
分 类 号:TP391[自动化与计算机技术—计算机应用技术]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:216.73.216.15