何新宇

作品数:4被引量:7H指数:2
导出分析报告
供职机构:中山大学资讯管理学院更多>>
发文主题:文本分类向量空间模型改进KNN维度索引表更多>>
发文领域:自动化与计算机技术更多>>
发文期刊:《情报理论与实践》《中山大学研究生学刊(社会科学版)》更多>>
所获基金:国家高技术研究发展计划国家自然科学基金更多>>
-

检索结果分析

署名顺序

  • 全部
  • 第一作者
结果分析中...
条 记 录,以下是1-4
视图:
排序:
基于维度索引表的改进KNN分类算法被引量:3
《情报理论与实践》2014年第5期102-106,共5页路永和 何新宇 
国家自然科学基金资助项目"面向文本分类的多学科协同建模理论与实验研究"的成果之一;项目编号:71373291
阐述传统KNN分类器的基本原理和其存在的不足之处;针对样本数量增大,维度上升时KNN算法中相似度计算量急剧增大的问题,提出基于维度索引表的改进KNN分类算法;该算法通过建立特征项维度索引表加速KNN算法中寻找K近邻;以搜狗自然语言实验...
关键词:文本分类 维度索引表 向量空间模型 分类算法 
文档相似矩阵在提高KNN分类效率中的应用被引量:2
《情报理论与实践》2014年第1期141-144,共4页路永和 何新宇 
国家高技术研究发展计划("863"计划)资助项目"农产品全供应链多源信息感知技术与产品开发"的成果;项目编号:2012AA101701
针对传统KNN分类算法在样本数量大、维度高的情况下相似度计算量大的问题,提出了基于相似矩阵的改进KNN分类算法。该算法通过计算样本两两之间的相似度,建立相似矩阵加速KNN算法中寻找K近邻;以搜狗自然语言实验室的文本分类语料库中的...
关键词:文本分类 K最近邻分类法 相似矩阵 算法 
基于中心词耦合度和PageRank的文本自动摘录算法被引量:1
《中山大学研究生学刊(社会科学版)》2013年第3期43-50,共8页何新宇 
阐述了自动文摘和PageRank算法的概念和步骤,并介绍了部分基于图排序的自动摘录算法;提出了一种基于中心词耦合度和PageRank的图排序文本自动摘录算法,通过文本特征筛选技术提取出文档中的中心词并定义了句子之间的中心词耦合度函数,再...
关键词:自动摘录 中心词 PAGERANK 耦合度 
锐化高斯模板在文本特征项权重调整方法中的应用被引量:1
《现代图书情报技术》2012年第12期39-44,共6页路永和 何新宇 
国家高技术研究发展计划(863计划)基金资助项目"农产品全供应链多源信息感知技术与产品开发--感知终端多通讯协议及汇聚节点研制"(项目编号:2012AA101701-03)的研究成果之一
阐述二维高斯模板和锐化高斯模板的构建过程及其对图像的锐化处理技术,提出文本特征项权重调整方法的主要思想,并以此为依据,论述基于锐化高斯模板的文本特征项权重调整方法。以搜狗自然语言实验室的文本分类语料库中的新闻文档作为实...
关键词:文本分类 锐化高斯模板 向量空间模型文本特征 
检索报告 对象比较 聚类工具 使用帮助 返回顶部