特征词权重

作品数:17被引量:116H指数:7
导出分析报告
相关领域:自动化与计算机技术更多>>
相关作者:崔宪坤李建强陈小莉张玉芳熊忠阳更多>>
相关机构:重庆大学中南大学西安工程大学北京邮电大学更多>>
相关期刊:《统计与决策》《计算机系统应用》《计算机科学与探索》《军民两用技术与产品》更多>>
相关基金:国家自然科学基金国家科技支撑计划重庆市自然科学基金国家教育部博士点基金更多>>
-

检索结果分析

结果分析中...
条 记 录,以下是1-10
视图:
排序:
改进二进制麻雀搜索的特征选择及文本聚类被引量:1
《重庆理工大学学报(自然科学)》2023年第8期166-176,共11页高新成 邵国铭 张海洋 周中雨 
国家自然科学基金项目(61702093);中国高校产学研创新基金项目(2021ITA02011);黑龙江省教育科学规划重点课题(GJB1423357)。
针对文本中存在冗余特征影响聚类精度等问题,提出一种结合蜣螂优化算法改进二进制麻雀搜索算法的特征选择及文本聚类算法。利用基于特征词权重的适应度函数完成文本特征评估,构建矢量空间模型;引入蜣螂优化算法中的圆周方向搜索机制,改...
关键词:特征选择 蜣螂优化算法 二进制麻雀搜索算法 k-means++ 文本聚类 特征词权重 
网络论坛文本特征词权重计算优化方法研究被引量:10
《情报理论与实践》2021年第5期187-192,共6页丁晓阳 王兰成 
[目的/意义]网络论坛是当前网络舆情汇聚、扩散的重要平台,而当前热点话题检测方法对大量主题论坛的应用效果较差,文章专门针对网络论坛的文本特点进行分析,旨在构建更科学、精准的特征词权重计算方法。[方法/过程]通过引入特征词类别...
关键词:特征提取 TF-IDF 文本分析 网络论坛 权重计算 
基于泊松分布的加权朴素贝叶斯文本分类算法被引量:12
《计算机工程》2020年第4期91-96,共6页赵博文 王灵矫 郭华 
国家自然科学基金(61771414)。
朴素贝叶斯(NB)算法应用于文本分类时具有简单性和高效性,但算法中属性独立性与重要性一致的假设,使其在精确度方面存在瓶颈.针对该问题,提出一种基于泊松分布的特征加权NB文本分类算法.结合泊松分布模型和NB算法,将泊松随机变量引入特...
关键词:文本分类 朴素贝叶斯算法 泊松分布 信息增益率 特征词权重 
一种基于HowNet语义计算的综合特征词权重计算方法被引量:4
《统计与决策》2018年第18期82-85,共4页孙丽莉 张小刚 
国家自然科学基金资助项目(61562072);新疆维吾尔自治区高校人文社科重点研究基地重点项目(090113B06)
传统文本特征词提取方法采用TF-IDF计算文本特征词的权重,但TF-IDF方法只使用了文本中的词频因素,体现不出特征词的位置信息,也忽略了特征词之间的语义相似关系,降低了提取特征词的准确性。针对此问题,文章提出了一种综合的文本特征词...
关键词:知网 词频与反文档频率 权重计算 语义相似度计算 
基于多特征的视频关联文本关键词提取方法被引量:5
《浙江工业大学学报》2017年第1期14-18,共5页王万良 潘蒙 
国家"十二五"科技支撑计划项目(2012BAD10B01);浙江省重大科技专项项目(2013C01113)
针对互联网多媒体视频数量的爆炸式增长导致快速获取视频的内容变得非常困难问题,提出了一种基于多特征的关键词提取算法TFL-WS算法.通过分析视频包含丰富的相关文本信息的特点,建立了基于改进TF和多特征的候选词权重计算公式,该公式将...
关键词:提取 视频内容 TF 特征词权重 
文本分类中基于熵的词权重计算方法研究被引量:11
《计算机科学与探索》2016年第9期1299-1309,共11页陈科文 张祖平 龙军 
国家自然科学基金No.61379109;高等学校博士学科点专项科研基金No.20120162110077~~
随着文本数据量变得很大且仍在迅猛增加,自动文本分类变得越来越重要。为了提高分类准确率,作为文本特征的词的权重计算方法是文本分类领域的研究热点之一。研究发现,基于信息熵的权重计算方法(熵加权)相对于其他方法更有效,但现有方法...
关键词:特征词权重 熵加权 文本分类 类别区分力 
基于特征词权重变更的检索优化策略被引量:5
《情报科学》2016年第7期70-75,共6页黄思思 
以无限逼近用户的真实检索需求为目的,基于传统检索系统的运行机制,提出了以用户行为数据为输入的检索优化策略。综合考虑用户的选择文档与忽略文档,对选择文档进行整合融为阶段性最能表征目标需求的目标文档,同时提取选择文档与忽略文...
关键词:特征词加权 信息检索 文本相似度 信息需求表征 
XML文档聚类中基于语义的特征词权重计算方法
《长沙理工大学学报(自然科学版)》2015年第2期72-77,共6页龙鹏飞 石奇 
国家自然科学基金资助项目(61303043)
在XML文档检索中,结果聚类是一种改善检索效果的有效方法,其文档距离度量是影响聚类质量的关键因素。针对XML文档检索结果聚类中TF×IDF方法的频率因子和长度因子处理上的不合理和不能突显重要词条的缺点,提出了一种基于"频率因子"和"...
关键词:潜在语义索引 检索结果聚类 权重算法 聚类算法 
改进的TF-IDF中文本特征词加权算法研究被引量:10
《软件导刊》2015年第4期67-69,共3页申剑博 
在自动文本分类中,TF-IDF算法是最为常用的特征权重计算方法。该算法运用广泛,但是存在不足:只考虑了特征词的频率和包含特征词的文档数量,没有考虑到特征词在类内和类间对权重的影响。对特征词权重计算方法进行了改进。为了解决特征词...
关键词:文本分类 TF-IDF算法 特征词权重 特征词分布 宏平均值 
基于特征词权重的文本分类被引量:1
《计算机与现代化》2012年第10期8-13,共6页杨莉 万常选 雷刚 俞涛 孔保新 
国家自然科学基金资助项目(61173146);国家社会科学基金资助项目(12CTQ042);江西省自然科学基金资助项目(2010GZS0067);江西省教育厅科技重点项目(GJJ09650)
在文本分类时,只有少数学者利用特征词权重对文本进行向量表示,但是所使用的特征选择算法没有考虑特征词权重的正负及其范围等。因此,本文在CHI统计基础上提出一种计算特征词类相关性的新方法,并根据各类特征集中包含的特征词的数量,选...
关键词:文本分类 特征选择 特征词类相关性 文本类相关性 
检索报告 对象比较 聚类工具 使用帮助 返回顶部