基于特征聚类与降维的新闻文本智能分类算法  

在线阅读下载全文

作  者:张鸿彦[1] ZHANG Hongyan

机构地区:[1]河南工程学院,河南郑州450000

出  处:《信息技术与信息化》2024年第4期106-109,共4页Information Technology and Informatization

基  金:河南省高等学校重点科研项目(22A520022);河南工程学院横向科研项目:HKJ2021139。

摘  要:文本分类是当前智能处理新闻数据信息的一种有效手段。为了提高信息处理的准确性和有效性,提出基于特征聚类与降维的新闻文本智能分类算法。首先,利用汉语词汇分析系统ICTCLAS对新闻文本分词作预处理,去除其中的停用词,并区分新闻文本的词性。然后,利用权重函数对新闻文本作降维处理,约简新闻文本的关键词集。最后,采用聚类分析技术对新闻文本特征实施聚类,得到不同类别的新闻文本。实验表明,所提出的算法得到的分类结果准确率在96%以上,召回率在98%以上,说明所提出的算法能够实现对新闻文本智能精准分类,具有良好的应用前景。

关 键 词:特征聚类 降维处理 新闻文本 智能分类 汉语词汇分析系统 权重函数 

分 类 号:TP391.1[自动化与计算机技术—计算机应用技术]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象