文档频率

作品数:33被引量:169H指数:6
导出分析报告
相关领域:自动化与计算机技术更多>>
相关作者:周红芳李想郑华陈绯张尧更多>>
相关机构:西安理工大学北京邮电大学北京信息科技大学中南大学更多>>
相关期刊:《计算机应用》《中文信息学报》《武汉理工大学学报(信息与管理工程版)》《集美大学学报(自然科学版)》更多>>
相关基金:国家自然科学基金新疆维吾尔自治区自然科学基金陕西省自然科学基金上海市科委科技支撑计划更多>>
-

检索结果分析

结果分析中...
条 记 录,以下是1-10
视图:
排序:
文本挖掘下的电网企业管理定量测算模型被引量:1
《武汉理工大学学报(信息与管理工程版)》2023年第4期619-624,共6页殷伍平 冯伟 莫志华 
为提高电网企业对用户的综合管理效率,推动电网企业的综合发展,对文本挖掘技术进行讨论,论述了电网企业的管理模型,构建了基于文本挖掘技术的电网企业管理定量测算模型,并对模型进行了综合评估。结果表明:模型在文档频率方法评估中的各...
关键词:电网企业 计算机 文本挖掘 企业管理 文档频率 
基于智能推荐的离退休干部信息管理系统研究
《自动化技术与应用》2021年第2期141-143,共3页张小俊 
离退休干部管理对于人力资源部门关于干部管理以及人力资源利用有重要的作用,传统的信息系统仅实现了对于离退休干部人事信息、档案信息的基本管理,对于系统用户并不能提供智能化的人力资源信息推荐。本文提出一种基于术语频率(TF)和反...
关键词:智能推荐 术语频率 反向文档频率 干部信息管理 
基于关键词策略和CNN的中文文本有害信息分类
《集美大学学报(自然科学版)》2020年第5期392-400,共9页陈德意 张宏怡 刘彩玲 张光斌 
提出一种新颖的中文文本分类框架。在该框架中,首先基于Word2Vec构建词向量模型,然后采用分词频文档频率(segmentation term frequency-document frequency,STF-DF)筛选出类别区分能力强的关键词,同时构建一种适合于中文文本分类的卷积...
关键词:词向量 分词频文档频率 特征词集合 Word2Vec模型 卷积神经网络 
基于归一化文档频率的文本分类特征选择方法被引量:4
《华东理工大学学报(自然科学版)》2019年第5期809-814,共6页赵鸿山 范贵生 虞慧群 
国家自然科学基金(61702334,61772200);上海市浦江人才计划(17PJ1401900);上海自然科学基金(17ZR1406900,17ZR1429700);华东理工大学教育教学规律与方法研究项目(ZH1726108)
特征选择是文本分类的一个重要过程,对分类性能的提升发挥着重要的作用。传统的文档频率(Document Frequency,DF)特征选择指标只是从全局的角度统计包含特征的文档数作为选择的依据,没有考虑特征与类别的相关性。针对该问题,本文从特征...
关键词:文本分类 特征选择 文档频率 归一化 
排名于后的深层Web数据源爬取
《九江学院学报(自然科学版)》2019年第3期69-72,共4页郭丽 
安徽省教育厅高校优秀青年人才支持计划重点项目资助(编号gxyqZD2018131);省级重点自然科学研究项目资助(编号KJ2017A665,KJ2017A666);2019年度安徽高校人文社会科学研究重点项目(编号SK2019A0920)的研究成果之一
在大数据时代,绝大多数数据并非来自表面Web,多数需求数据是通过超链接互连的Web引擎。相反,宝贵的数据库通常存在于深层网络中,即隐藏的网络-在查询接口后端。自从众多应用程序,如垂直门户网站,需要深入的Web数据,各种爬行方法都是以最...
关键词:深层网络爬取 查询选择 文档频率 返回限制 
改进的文本特征选取算法研究被引量:2
《计算机技术与发展》2019年第5期66-69,共4页朱世玲 郑彦 
国家"863"高技术发展计划项目(2006AA01Z201)
特征选取的好坏决定了文本分类的准确度。文本特征选取通常有文档频率、互信息、信息增益、卡方统计量等方法。文中讨论了文档频率和互信息在特征选取时的缺点,基于这些缺点,提出了一种混合文档频率和互信息的改进算法。文档频率进行特...
关键词:特征选取 互信息 文档频率 文本分类 改进互信息 改进文档频率 
一种基于HowNet语义计算的综合特征词权重计算方法被引量:4
《统计与决策》2018年第18期82-85,共4页孙丽莉 张小刚 
国家自然科学基金资助项目(61562072);新疆维吾尔自治区高校人文社科重点研究基地重点项目(090113B06)
传统文本特征词提取方法采用TF-IDF计算文本特征词的权重,但TF-IDF方法只使用了文本中的词频因素,体现不出特征词的位置信息,也忽略了特征词之间的语义相似关系,降低了提取特征词的准确性。针对此问题,文章提出了一种综合的文本特征词...
关键词:知网 词频与反文档频率 权重计算 语义相似度计算 
互联网软件错误日志聚类被引量:6
《小型微型计算机系统》2018年第5期865-870,共6页程世文 裴丹 王长进 
国家自然科学基金项目(61472214)资助
互联网内容提供商在实际运营过程中,所维护的各项业务随时可能会遇到各种各样的问题,将相应的大量错误日志经过聚类后及时反馈给相应的研发人员是排除问题的首要因素.为了有效解决海量非规范的错误日志的聚类问题,本文提出互联网软件错...
关键词:聚类 错误日志 文档频率 Canopy算法 K-MEANS算法 
电商评论情感挖掘模型被引量:3
《南昌大学学报(理科版)》2018年第1期88-94,共7页熊乐 饶泓 
国家自然科学基金资助项目(61262047);江西省重点研发计划基金资助项目(20171BBE50063);江西省教育厅科技基金资助项目(GJJ14141)
通过对商品评论的挖掘,商家可以更好地了解消费者的需求从而及时改善产品的设计。目前,针对商品评论的挖掘大多数采用的方法是提取有效的情感特征并利用分类器进行分类。然而由于电商评论文本表述方式多样、行文不规范,口语化等特点,数...
关键词:情感分析 停用词表 情感词典 文档频率 TF-IDF 
改进信息增益的维吾尔文特征选择方法被引量:3
《计算机工程与应用》2017年第23期34-38,共5页韩军兵 哈力旦.阿布都热依木 古力努尔.艾尔肯 何燕 
国家自然科学基金(No.61163026;No.60865001);新疆维吾尔自治区自然科学基金(No.2016D01C048)
特征选择是维吾尔语文本分类的关键技术,对分类结果将产生直接的影响。为了提高传统信息增益在维吾尔文特征选择中的效果,在深度分析维吾尔文语种特点的基础上,提出了一种新的信息增益特征选择方法。该方法结合类词频和特征分布系数以...
关键词:文本分类 信息增益 类词频 倒逆转文档频率 特征选择 
检索报告 对象比较 聚类工具 使用帮助 返回顶部