检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
作 者:吴彤 张贯虹[1] 陈婷婷 WU Tong;ZHANG Guan-hong;CHEN Ting-ting(School of Artificial Intelligence and Big Data,Hefei University,Hefei 230601,China)
机构地区:[1]合肥学院人工智能与大数据学院,合肥230601
出 处:《合肥学院学报(综合版)》2021年第5期109-114,共6页Journal of Hefei University:Comprehensive ED
基 金:安徽省重点研究与开发计划基金资助项目“基于知识图谱的电子数据取证一体化平台与示范”(202104d07020006);安徽省自然科学基金资助项目“面向推荐引擎和数据特性的文本情感分析方法研究”(2108085MF223);安徽省科技重大专项基金资助项目“基于工业数据的驱动电机智能装配设备远程监控与故障诊断研究与应用”(201903a05020011)资助。
摘 要:针对微博评论数据的分布不平衡特点在传统机器学习方法决策树的基础上,提出一种新的解决方法,使用集成学习RGF算法对数据进行迭代训练,进而调整训练样本的权重,获得最优的结果。实验结果表明在不同语料库数据集下,本方法较其他模型在准确率、召回率和F1值上都取得了良好的表现,验证了本方法在微博非平衡短文本数据集中进行情感分析的有效性。This paper proposes a new solution to the imbalanced distribution of comment data on Weibo.Based on the decision tree of the traditional machine learning method,the integrated learning RGF algorithm is used to train the data iteratively and adjust the weight of the training sample to obtain the optimal result.Compared with other models under different corpora,the accuracy rate,recall rate and F1 value have achieved good performance,which verifies the effectiveness of the proposed method in sentiment analysis for the Weibo imbalanced short-text data sets.
分 类 号:TN912.3[电子电信—通信与信息系统]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:216.73.216.32