黄永光

作品数:2被引量:38H指数:2
导出分析报告
供职机构:哈尔滨工业大学更多>>
发文主题:快速聚类算法文本特征串聚类计算机应用更多>>
发文领域:自动化与计算机技术更多>>
发文期刊:《中文信息学报》更多>>
所获基金:国家自然科学基金更多>>
-

检索结果分析

署名顺序

  • 全部
  • 第一作者
结果分析中...
条 记 录,以下是1-2
视图:
排序:
面向变异短文本的快速聚类算法被引量:17
《中文信息学报》2007年第2期63-68,共6页黄永光 刘挺 车万翔 胡晓光 
本文主要针对近些年来大量出现在聊天语言中和手机短信中的短文本,提出了一种快速有效的聚类算法。这些短文本由于具有不规范性和大量相似性等特点,我们称其为变异短文本。本文在原有的网页去重算法的基础上,根据变异短文本的特点,...
关键词:人工智能 模式识别 检索 特征串 聚类 
基于类别特征域的文本分类特征选择方法被引量:21
《中文信息学报》2005年第6期21-27,共7页赵世奇 张宇 刘挺 陈毅恒 黄永光 李生 
国家自然科学基金重点资助项目(60435020)
特征选择是文本分类的关键问题之一,而噪音与数据稀疏则是特征选择过程中遇到的主要障碍。本文介绍了一种基于类别特征域的特征选择方法。该方法首先利用“组合特征抽取”[1]的方法去除原始特征空间中的噪音,从中抽取出候选特征。这里,...
关键词:计算机应用 中文信息处理 文本分类 特征选择 类别特征域 
检索报告 对象比较 聚类工具 使用帮助 返回顶部