检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
作 者:胡翔 HU Xiang
出 处:《信息技术与信息化》2025年第2期164-167,共4页Information Technology and Informatization
摘 要:在实际文本自动分类任务中,因文本的多样性和复杂性,常会遇到一些特殊的、不符合常规分类模式的文本。这些文本往往使得标引深度和标引专指度难以达到理想的平衡状态。这种不平衡导致在处理复杂模型和大规模数据时,支持向量机(SVM)模型在参数的选择上很难找到最优参数,造成分类精度较低的结果。为此,文章提出一种基于遗传算法优化支持向量机的文本自动分类方法。通过预处理来提高文本数据的质量,并引入TF-IDF(词频-逆文档频率)和词共现分析,构建出高效的文本数据特征向量。利用遗传算法对SVM模型参数进行优化,自动搜索最佳的参数配置,提升模型的分类性能。将预处理后的文本数据输入到优化后的SVM模型中,模型通过学习文本数据的特征向量与类别标签之间的映射关系,实现对新文本的自动分类。实验结果表明,该方法在分类精度、Kappa统计量和汉明损失3个关键指标上,均显著优于对比方法,有效提高了文本自动分类的准确性和稳定性。
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:216.73.216.43