检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
作 者:张鸿彦[1] ZHANG Hongyan
机构地区:[1]河南工程学院,河南郑州450000
出 处:《信息技术与信息化》2024年第4期106-109,共4页Information Technology and Informatization
基 金:河南省高等学校重点科研项目(22A520022);河南工程学院横向科研项目:HKJ2021139。
摘 要:文本分类是当前智能处理新闻数据信息的一种有效手段。为了提高信息处理的准确性和有效性,提出基于特征聚类与降维的新闻文本智能分类算法。首先,利用汉语词汇分析系统ICTCLAS对新闻文本分词作预处理,去除其中的停用词,并区分新闻文本的词性。然后,利用权重函数对新闻文本作降维处理,约简新闻文本的关键词集。最后,采用聚类分析技术对新闻文本特征实施聚类,得到不同类别的新闻文本。实验表明,所提出的算法得到的分类结果准确率在96%以上,召回率在98%以上,说明所提出的算法能够实现对新闻文本智能精准分类,具有良好的应用前景。
关 键 词:特征聚类 降维处理 新闻文本 智能分类 汉语词汇分析系统 权重函数
分 类 号:TP391.1[自动化与计算机技术—计算机应用技术]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:18.119.172.58