基于遗传算法优化支持向量机的文本自动分类方法  

在线阅读下载全文

作  者:胡翔 HU Xiang

机构地区:[1]安庆师范大学数理学院,安徽安庆246133

出  处:《信息技术与信息化》2025年第2期164-167,共4页Information Technology and Informatization

摘  要:在实际文本自动分类任务中,因文本的多样性和复杂性,常会遇到一些特殊的、不符合常规分类模式的文本。这些文本往往使得标引深度和标引专指度难以达到理想的平衡状态。这种不平衡导致在处理复杂模型和大规模数据时,支持向量机(SVM)模型在参数的选择上很难找到最优参数,造成分类精度较低的结果。为此,文章提出一种基于遗传算法优化支持向量机的文本自动分类方法。通过预处理来提高文本数据的质量,并引入TF-IDF(词频-逆文档频率)和词共现分析,构建出高效的文本数据特征向量。利用遗传算法对SVM模型参数进行优化,自动搜索最佳的参数配置,提升模型的分类性能。将预处理后的文本数据输入到优化后的SVM模型中,模型通过学习文本数据的特征向量与类别标签之间的映射关系,实现对新文本的自动分类。实验结果表明,该方法在分类精度、Kappa统计量和汉明损失3个关键指标上,均显著优于对比方法,有效提高了文本自动分类的准确性和稳定性。

关 键 词:遗传算法 支持向量机 文本自动分类 特征向量 优化模型参数 

分 类 号:TP391.1[自动化与计算机技术—计算机应用技术] TP18[自动化与计算机技术—计算机科学与技术]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象