段建国

作品数:3被引量:37H指数:1
导出分析报告
供职机构:中国科学院计算技术研究所更多>>
发文主题:文本分类信息增益交叉熵特征选择算法信息熵更多>>
发文领域:自动化与计算机技术更多>>
发文期刊:《计算机工程与设计》《中文信息学报》《计算机工程与应用》更多>>
所获基金:国家重点基础研究发展计划更多>>
-

检索结果分析

署名顺序

  • 全部
  • 第一作者
结果分析中...
条 记 录,以下是1-3
视图:
排序:
基于信息论的文本分类模型被引量:1
《计算机工程与设计》2008年第24期6312-6315,共4页唐亮 段建国 许洪波 梁玲 
国家973重点基础研究发展计划基金项目(2004CB318109、2007CB311100)
从信息论的角度,提出了一种新的文本分类模型。该模型以文本提供的关于类别的信息作为分类依据,从另一个角度来思考文本分类问题。从实用性的角度来看,该模型与传统的朴素贝叶斯模型和基于KL距离的中心向量法具有一定的关系,并给出了证...
关键词:文本分类 信息论 广义信息论 互信息 信息熵 特征权重 
基于互信息最大化的特征选择算法及应用被引量:35
《计算机工程与应用》2008年第13期130-133,共4页唐亮 段建国 许洪波 梁玲 
国家重点基础研究发展规划(973)(the National Grand Fundamental Research 973 Program of China under Grant No.2004CB318109,No.2007CB311100)
该文以互信息最大化原则为指导,经过推导和分析后提出了一种基于信息论模型的新的特征选择算法,称之为基于互信息最大化的特征选择算法(MaxMI)。基本思想就是特征选择后,应当尽可能多地保留关于类别的信息。该算法与传统的信息增益、互...
关键词:文本分类 特征选择 交叉熵 信息增益 互信息最大化 
基于推拉策略的文本分类增量学习研究被引量:1
《中文信息学报》2008年第1期37-43,共7页罗长升 段建国 郭莉 
国家973资助项目(2004CB318109,2007CB311100)
学习算法是否具有增量学习能力是衡量其是否适合于解决现实问题的一个重要方面。增量学习使学习算法的时间和空间资源消耗保持在可以管理和控制的水平,已被广泛应用于解决大规模数据集问题。针对文本分类问题,本文提出了增量学习算法的...
关键词:计算机应用 中文信息处理 增量学习 推拉策略 文本分类 中心法 
检索报告 对象比较 聚类工具 使用帮助 返回顶部