检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
作 者:李卫卫 葛欣杭 刘晓丹 LI Wei-wei;GE Xin-hang;LIU Xiao-dan(School of Information Engineering,Zhengzhou College of Finance and Economics,Zhengzhou 450000,China)
机构地区:[1]郑州财经学院信息工程学院,河南郑州450044
出 处:《电脑与电信》2025年第1期27-31,共5页Computer & Telecommunication
基 金:郑州财经学院校级科研项目“基于多尺度超像素的高光谱图像分类模型研究”,项目编号:ZCKY2024QN-0107。
摘 要:新闻文本种类较多、内容繁杂,在分类时较易产生关键词缺失、特征提取不全面等问题,导致文本分类准确率降低。因此在分类特征提取以及模型输入层进行了改进,提出一种基于改进TF-IDF的FastText文本分类算法,并将该方法应用至财经新闻文本数据,以验证该模型的分类性能。实验结果表明,所提分类模型的财经新闻文本分类精确率达到95.82%,相较于对比方案,最高提升6.91%,证明所提方案具有一定的有效性以及可行性,能够有效提升新闻文本分类效果。There are many types and complex contents of news texts,which can easily lead to problems such as missing keywords and incomplete feature extraction during classification,resulting in a decrease in the accuracy of text classification.Therefore,this paper improves the feature extraction of classification and the input layer of the model,and proposes a FastText text classification al‐gorithm based on improved TF-IDF.This method is applied to financial news text data to verify the classification performance of the model.The experimental results show that the precision of the proposed classification model for financial news text classification reaches 95.82%,which is 6.91%higher than the comparison scheme.This proves that the proposed scheme is effective and feasible,and can effectively improve the classification effect of news texts.
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:216.73.216.7