基于正则化贪心森林算法的情感分析方法研究  被引量:1

On the Sentiment Analysis Based on Regularized Greedy Forest Algorithm

在线阅读下载全文

作  者:吴彤 张贯虹[1] 陈婷婷 WU Tong;ZHANG Guan-hong;CHEN Ting-ting(School of Artificial Intelligence and Big Data,Hefei University,Hefei 230601,China)

机构地区:[1]合肥学院人工智能与大数据学院,合肥230601

出  处:《合肥学院学报(综合版)》2021年第5期109-114,共6页Journal of Hefei University:Comprehensive ED

基  金:安徽省重点研究与开发计划基金资助项目“基于知识图谱的电子数据取证一体化平台与示范”(202104d07020006);安徽省自然科学基金资助项目“面向推荐引擎和数据特性的文本情感分析方法研究”(2108085MF223);安徽省科技重大专项基金资助项目“基于工业数据的驱动电机智能装配设备远程监控与故障诊断研究与应用”(201903a05020011)资助。

摘  要:针对微博评论数据的分布不平衡特点在传统机器学习方法决策树的基础上,提出一种新的解决方法,使用集成学习RGF算法对数据进行迭代训练,进而调整训练样本的权重,获得最优的结果。实验结果表明在不同语料库数据集下,本方法较其他模型在准确率、召回率和F1值上都取得了良好的表现,验证了本方法在微博非平衡短文本数据集中进行情感分析的有效性。This paper proposes a new solution to the imbalanced distribution of comment data on Weibo.Based on the decision tree of the traditional machine learning method,the integrated learning RGF algorithm is used to train the data iteratively and adjust the weight of the training sample to obtain the optimal result.Compared with other models under different corpora,the accuracy rate,recall rate and F1 value have achieved good performance,which verifies the effectiveness of the proposed method in sentiment analysis for the Weibo imbalanced short-text data sets.

关 键 词:决策树 集成学习 情感分析 正则化贪心森林 

分 类 号:TN912.3[电子电信—通信与信息系统]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象