文本特征选择

作品数:44被引量:247H指数:9
导出分析报告
相关领域:自动化与计算机技术更多>>
相关作者:刘海峰林永民刘守生陈宏伟叶志伟更多>>
相关机构:湖北工业大学解放军理工大学北京交通大学山东师范大学更多>>
相关期刊:《计算机应用与软件》《湖北工业大学学报》《计算机应用研究》《小型微型计算机系统》更多>>
相关基金:国家自然科学基金山东省自然科学基金江苏省自然科学基金黑龙江省教育厅科学技术研究项目更多>>
-

检索结果分析

结果分析中...
条 记 录,以下是1-10
视图:
排序:
基于改进TFIDF算法的文本特征选择和聚类分析被引量:1
《微型电脑应用》2023年第10期181-183,187,共4页赵军愉 柴小亮 李士林 徐松晓 王强 
为了提高大量文本数据的特征选择能力,采用全覆盖粒计算方法对特征选择算法的数据高维性与稀疏性进行分析。针对TFIDF算法存在的缺陷,设计了一种经过改进后的TFIDF_SP算法,以区分文档内处于不同部位的特征词重要性,并根据不同特征选择...
关键词:文本特征选择 改进TFIDF算法 聚类效果 主题模型 
基于正余弦算法的文本特征选择被引量:1
《计算机工程与科学》2022年第8期1467-1473,共7页文武 万玉辉 文志云 
为获取文本中的较优特征子集,剔除干扰和冗余特征,提出了一种结合过滤式算法和群智能算法的混合特征寻优算法。首先计算每个特征词的信息增益值,选取较优的特征作为预选特征集合,再利用正余弦算法对预选特征进行寻优,获取精选特征集合...
关键词:特征选择 正余弦 惯性权重 分类准确率 
基于改进CHI和PCA的文本特征选择被引量:5
《计算机工程与科学》2021年第9期1645-1652,共8页文武 万玉辉 张许红 文志云 
针对文本数据中含有大量噪声和冗余特征,为获取更有代表性的特征集合,提出了一种结合改进卡方统计(ICHI)和主成分分析(PCA)的特征选择算法(ICHIPCA)。首先针对CHI算法忽略词频、文档长度、类别分布及负相关特性等问题,引入相应的调整因...
关键词:文本分类 PCA CHI 降维 特征选择 
面向文本特征选择的去冗余相对判别准则被引量:2
《山西大学学报(自然科学版)》2021年第4期688-694,共7页王家琪 张莉 
江苏省高校自然科学研究项目(19KJA550002);江苏省六大人才高峰项目(XYDXX-054);江苏高校优势学科建设工程资助项目
文本作为一种重要信息载体,对之提取的特征有着直观的含义,但其数量太多。因而,选取合适的特征子集对后续任务至关重要。作为基于文档频率的文本特征选择方法,相对判别准则只关注了特征与类别的相关性,并以此来进行特征选择。为了去除...
关键词:机器学习 特征选择 自然语言处理 相对判别准则 词嵌入 文本分类 
基于信息增益与CHI卡方统计的情感文本特征选择被引量:2
《计算机与数字工程》2020年第11期2560-2563,共4页杨新怡 肖利雪 
信息增益(IG)是通过某个特征词的缺失与存在两种情况下,语料中前后信息的增加,衡量某个特征词的重要性,其只考虑到对整体贡献,易忽略局部影响;卡方统计(CHI)是利用统计学的"假设检验"的基本思想:首先假设特征词与类别直接是不相关的,其...
关键词:信息增益(IG) 卡方统计(CHI) 情感文本 支持向量机(SVM) 
基于信息增益和萤火虫算法的文本特征选择被引量:6
《计算机工程与设计》2019年第12期3457-3462,共6页文武 赵成 赵学华 刘颖 范荣妹 
针对传统的文本特征选择方法所选特征子集精度不高的问题,提出一种结合信息增益和萤火虫算法的特征选择方法。计算所有特征词的信息增益并按从高到低排序,在排序靠前的特征集合上利用萤火虫算法寻优搜索得到最优特征子集。为避免萤火虫...
关键词:信息增益 萤火虫算法 特征选择 步长因子 文本分类 
基于遗传算法的文本特征选择被引量:15
《科学技术与工程》2019年第33期302-307,共6页刘成锴 王斌君 吴勇 
文本特征选择是自然语言处理中的关键问题。针对文本特征的高维性和稀疏性问题,在过滤式特征选择算法文档-逆文档评率(term frequency-inverse document frequency,TF-IDF)的基础上,提出了用遗传算法对文本特征进行优化选择,使其最大程...
关键词:文本分类 文本特征 特征降维 遗传算法 
基于多策略改进蝙蝠算法的文本特征选择
《湖北工业大学学报》2019年第5期64-66,71,共4页侯乔 陈宏伟 
国家自然科学基金(61772180);湖北省自然科学基金(2013CFB020)
特征选择是文本分类过程的重要处理步骤,在其他分类预处理环节和分类算法确定的条件下,通过传统特征选择方法很难大幅度提高文本分类的准确率。针对此问题,介绍了一个基于改进蝙蝠优化的新的文本特征选择方法,即利用传统的特征选择方法...
关键词:特征选择 蝙蝠算法 文本分类 多策略改进 
面向短文本的特征选择及文本表示被引量:1
《计算机与现代化》2019年第3期95-101,126,共8页马建红 刘广森 姚爽 杨智 
中国科学技术咨询服务中心计算机辅助创新设计公共服务平台建设服务采购项目(HSZT2015FD/254)
短文本由于其稀疏性、实时性、非标准性等特点,在文本特征选择和文本表示方面存在较多问题,从而影响文本分类精度。针对文本特征选择方面存在较高的特征维数灾难的问题,提出一种二阶段的文本特征选择算法。首先在互信息算法的基础上,引...
关键词:文本特征选择 文本表示 遗传算法 文本分类 
融合CHI与信息增益的情感文本特征选择被引量:3
《西安工程大学学报》2018年第6期713-717,共5页黄梦莹 张晓滨 
陕西省自然科学基金(2015JQ5157)
针对卡方统计量(CHI)忽略低频词对文本分类的影响以及信息增益(IG)只考虑对整体的贡献,忽略对局部影响的问题,通过分析CHI和IG特征选择算法,提出融合CHI和IG,适用于情感文本分类的文本特征选择算法(CHI-IG).该算法在CHI和IG 2种特征选...
关键词:卡方统计量(CHI) 信息增益 特征选择 情感文本 随机森林 支持向量机 
检索报告 对象比较 聚类工具 使用帮助 返回顶部