孙婧昊

作品数:6被引量:74H指数:4
导出分析报告
供职机构:中山大学信息科学与技术学院计算机科学系更多>>
发文主题:遗传算法初始化文本聚类高维数据聚类更多>>
发文领域:自动化与计算机技术更多>>
发文期刊:《计算机工程》《计算机应用》《计算机科学》更多>>
所获基金:国家自然科学基金广东省自然科学基金更多>>
-

检索结果分析

署名顺序

  • 全部
  • 第一作者
结果分析中...
条 记 录,以下是1-6
视图:
排序:
基于边界点的可分离性度量及特征选择被引量:1
《计算机工程》2007年第10期79-80,89,共3页任江涛 孙婧昊 黄焕宇 印鉴 
国家自然科学基金资助项目(60573097);广东省自然科学基金资助项目(04300462;05200302)
提出了一种新的面向高维数据的特征选择方法,在特征子集搜索上采用遗传算法进行随机搜索,在特征子集评价上采用基于边界点的可分性度量作为评价指标及适应度。实验结果表明,该算法可有效地找出具有较好的可分离性的特征子集,从而实现降...
关键词:特征选择 边界点 可分离性 遗传算法 
一种基于信息增益及遗传算法的特征选择算法被引量:18
《计算机科学》2006年第10期193-195,251,共4页任江涛 孙婧昊 黄焕宇 印鉴 
国家自然科学基金资助(60573097);广东省自然科学基金资助(05200302;04300462)。
特征选择是模式识别及数据挖掘等领域的重要问题之一。针对高维数据对象,特征选择一方面可以提高分类精度和效率,另一方面可以找出富含信息的特征子集。针对此问题,本文提出一种综合了filter模型及wrapper模型的特征选择方法,首先基于...
关键词:特征选择 信息增益 遗传算法 
基于遗传算法及聚类的基因表达数据特征选择被引量:4
《计算机科学》2006年第9期155-156,224,共3页任江涛 黄焕宇 孙婧昊 印鉴 
国家自然科学基金资助(60573097);广东省自然科学基金资助(05200302;04300462)
特征选择是模式识别及数据挖掘等领域的重要问题之一。针对高维数据对象(如基因表达数据)的特征选择,一方面可以提高分类及聚类的精度和效率,另一方面可以找出富含信息的特征子集,如发现与疾病密切相关的重要基因。针对此问题,本文提出...
关键词:特征选择 遗传算法 聚类 基因表达数据 
一种改进的基于特征赋权的K均值聚类算法被引量:10
《计算机科学》2006年第7期186-187,共2页任江涛 施潇潇 孙婧昊 黄焕宇 印鉴 
国家自然科学基金项目(60374059);广东省自然科学基金项目(04300462)资助
聚类分析是数据挖掘及机器学习领域内的重点问题之一。近年来,为了提高聚类质量,借鉴和引入了分类领域特征选择及特征赋权思想,提出了一些基于特征赋权的聚类算法。在这些研究基础上,本文提出了一种基于密度的初始中心点选择算法,...
关键词:聚类 特征赋权 初始化 
基于相关性分析及遗传算法的高维数据特征选择被引量:17
《计算机应用》2006年第6期1403-1405,共3页任江涛 黄焕宇 孙婧昊 印鉴 
国家自然科学基金资助项目(60573097);广东省自然科学基金资助项目(04300462;05200302)
特征选择是模式识别及数据挖掘等领域的重要问题之一。针对高维数据对象,特征选择一方面可以提高分类精度和效率,另一方面可以找出富含信息的特征子集。针对此问题,提出了一种综合了filter模型及wrapper模型的特征选择方法,首先基于特...
关键词:特征选择 相关性 遗传算法 
一种用于文本聚类的改进的K均值算法被引量:24
《计算机应用》2006年第B06期73-75,共3页任江涛 孙婧昊 施潇潇 黄焕宇 印鉴 
国家自然科学基金(60573097);广东省自然科学基金(04300462;05200302)
K均值算法是聚类分析中使用最为广泛的算法之一。针对文本聚类所面临的维数灾难,稀疏向量以及标准K均值算法初始中心点选择的随机性等问题,提出了一种面向文本聚类的改进的K均值算法,通过运用特征选择及降维、稀疏向量筛除、基于密度及...
关键词:文本聚类 特征选择 初始化 
检索报告 对象比较 聚类工具 使用帮助 返回顶部