期望交叉熵

作品数:12被引量:76H指数:5
导出分析报告
相关领域:自动化与计算机技术更多>>
相关作者:周奇年张振浩徐登彩孙承杰单丽莉更多>>
相关机构:重庆大学浙江理工大学桂林电子科技大学哈尔滨工业大学更多>>
相关期刊:《武汉大学学报(工学版)》《情报学报》《计算机工程与设计》《哈尔滨工业大学学报》更多>>
相关基金:国家自然科学基金中央高校基本科研业务费专项资金国家科技重大专项海南省自然科学基金更多>>
-

检索结果分析

结果分析中...
条 记 录,以下是1-10
视图:
排序:
基于改进CHI和带权ECE结合的特征选择方法被引量:4
《计算机应用研究》2019年第10期2962-2964,共3页蔡镇 高健 秦晓军 
国家自然科学基金资助项目(61732018)
针对文本分类特征选择方法中的卡方统计(CHI)和期望交叉熵(ECE),分析了其特点和不足。为了避免传统CHI和ECE方法在不平衡数据集上分类效果差的问题,通过引入调节因子和除去负相关影响因素,给出了改进的CHI方法(pCHI),并以加权的方式弥补...
关键词:卡方统计 期望交叉熵 特征选择 文本分类 
融合词语共现距离和类别信息的短文本特征提取方法被引量:3
《计算机工程与科学》2018年第9期1689-1695,共7页马慧芳 邢玉莹 王双 张旭鹏 
国家自然科学基金(61762078;61363058);广西可信软件重点实验室研究课题(kx201705);2016年甘肃省大学生创新创业训练计划项目(201610736040;201610736041)
针对传统特征加权方法未充分考虑词语之间的语义信息和类别分布信息的不足,提出了一种融合词语共现距离和类别信息的短文本特征提取方法。一方面,将同一短文本中两个词语之间的间隔词数作为共现距离,计算它们之间的相关度。通过计算这...
关键词:短文本 共现距离 期望交叉熵 特征提取 
基于背景重构与边缘相关短文本特征选择方法被引量:1
《武汉大学学报(工学版)》2016年第3期469-475,共7页张海涛 王斌君 王靖亚 
公安部公安理论及软科学研究重点项目(编号:2013LLYJGADX003)
为了解决短文本对象特征空间稀疏性与背景缺失造成的精确分类困难与语义混淆问题,提出一种背景补偿与边缘相关计算的特征选择方法.通过提取并利用文本间存在的关联性建立小样本簇背景特征集,重构特征空间,并结合边缘相关性分析确定最终...
关键词:背景重构 期望交叉熵 边缘相关 特征选择 
用于中文文本分类的基于类别区分词的特征选择方法被引量:8
《计算机应用与软件》2013年第3期193-195,共3页周奇年 张振浩 徐登彩 
特征选择是中文文本分类过程中的一个重要过程,特征项选择的优劣直接影响文本分类的准确率。在分析几种特征选择方法的基础上,提出一种类别区分词的特征选择方法。实验结果表明,类别区分词的特征选择方法的分类效率高于传统方法,从而验...
关键词:文本分类 特征选择 类别区分词 信息增益 互信息 期望交叉熵 
中文文本自动分类中的特征选择改进与研究
《工业控制计算机》2012年第11期89-90,92,共3页张振浩 周奇年 杨继慧 徐登彩 
特征选择是中文文本分类过程中的一个关键环节,文本特征项选择的优劣将直接影响文本分类的准确率。针对传统的特征选择算法没有考虑到特征项的类别区分度在特征选择中的作用而丧失了一些优秀的特征项的问题,文中通过引入特征项的类别区...
关键词:中文文本自动分类 特征选择 类别区分度 互信息 期望交叉熵 
基于改进隐马尔可夫模型的文本分类研究被引量:3
《微电子学与计算机》2012年第11期161-165,共5页李开荣 孔照昆 陈桂香 朱俊武 
国家自然科学基金项目(61170201)
将一种改进的隐马尔可夫模型(HMM)应用于文本分类中,在考虑其前向依赖的同时,需考虑状态的后向依赖性.将当前观测值和和当前状态对其后一状态的依赖性加入模型的学习,这样的改进模型能有效提高文本信息抽取准确率.在文本分类过程研究中...
关键词:隐马尔可夫模型 文本分类 期望交叉熵(ECE) χ2统计 TF-IDF方法 
基于特征选择的实体关系抽取被引量:9
《计算机应用研究》2012年第2期530-532,共3页毛小丽 何中市 邢欣来 刘莉 
中央高校基本科研业务费科研专项资助项目(CDJXS11180020);国家科技重大专项项目(2008ZX07315-001)
提出了一种实体关系抽取方案,该方案针对实体关系抽取中特征空间维数过高问题,引入了文本分类中的特征选择算法,如信息增益、期望交叉熵和x2统计,实现了特征空间降维。实验结果表明,各特征选择算法均能在尽量保证抽取性能的同时有效地...
关键词:关系抽取 特征选择 信息增益 期望交叉熵 x2统计 
文本分类中特征选择方法的比较与改进被引量:25
《哈尔滨工业大学学报》2011年第S1期319-324,共6页单丽莉 刘秉权 孙承杰 
国家自然科学基金资助项目(61073127)
为了在面向旅游领域的文本分类系统中选择有效的分类特征,提高分类性能,本文根据系统采用的训练集、训练过程及分类算法等因素重新对各常用的特征选择方法进行了综合实验评测,比较了五种常用的特征选择方法,对于评测结果最好的三种函数...
关键词:文本分类 特征选择 期望交叉熵 
基于索引项权重的文本特征选择方法被引量:4
《计算机工程与设计》2010年第5期1149-1151,共3页王海鹃 韩立新 甄志龙 
国家自然科学基金项目(60673186)
为改善文本分类的效率和效果,降低计算复杂度,在分析了经典的特征选择方法后,提出加权的文本特征选择方法。该方法不仅利用数据集中文本的个数,还充分考虑到索引项的权重信息,并构造新的评估函数,改进了信息增益、期望交叉熵以及文本证...
关键词:文本分类 特征选择 索引项权重 信息增益 期望交叉熵 文本证据权 
文本分类中一种基于选择的二次特征降维方法被引量:8
《情报学报》2009年第1期23-27,共5页刘海峰 王元元 姚泽清 陈琦 
国家自然科学基金资助项目(编号:70571087).
特征选择和特征抽取是文本分类中特征降维的主要方法。目前各种特征选择方法主要致力于度量特征与文本类别的相关性,却很少考虑特征之间的冗余性问题,从而影响特征降维的效果。本文提出一种基于选择的两步特征选择方法,既考虑一些类...
关键词:文本分类 特征选择 互信息 期望交叉熵 
检索报告 对象比较 聚类工具 使用帮助 返回顶部