许虎寅

作品数:5被引量:31H指数:3
导出分析报告
供职机构:西北师范大学数学与信息科学学院更多>>
发文主题:聚类词频文档特征选择算法DBSCAN更多>>
发文领域:自动化与计算机技术更多>>
发文期刊:《电脑知识与技术》《微电子学与计算机》更多>>
所获基金:国家自然科学基金美国福特基金甘肃省科技攻关计划甘肃省自然科学基金更多>>
-

检索结果分析

署名顺序

  • 全部
  • 第一作者
结果分析中...
条 记 录,以下是1-5
视图:
排序:
基于DF算法改进的文本聚类特征选择算法被引量:6
《甘肃联合大学学报(自然科学版)》2012年第1期51-54,共4页樊东辉 王治和 陈建华 许虎寅 
通过研究文本特征选取中权重的计算问题,提出了一种利用特征词的熵函数加权的权值的计算方法,不但考察了特征词的文档频数,而且考察了它们在文档中出现的次数,使选出的特征子集更具有较好的代表性.实验表明,改进后的算法对聚类结果有了...
关键词:特征选择 文档频 词频 
一种改进的基于密度的聚类算法被引量:20
《微电子学与计算机》2012年第2期44-47,53,共5页许虎寅 王治和 
美国福特基金会资助项目(1085-1398);国家自然科学基金资助项目(10771171);甘肃省科技攻关基金项目(2GS035-A052-011)
聚类是数据挖掘领域中的一个重要研究方向,在基于密度的聚类算法DBSCAN的基础上,提出了一种改进的基于密度的聚类算法,该算法在核心点的邻域扩展中不再将邻域内的点作为种子点,而是按顺序选择一个邻域外未被标记的点作为种子点,然后分...
关键词:DBSCAN 聚类 密度 核心点 邻域 
基于聚类的KNN算法改进被引量:2
《电脑知识与技术(过刊)》2011年第12X期9033-9034,9037,共3页樊东辉 王治和 陈建华 许虎寅 
通过研究KNN算法,提出了一种利用训练集文本聚类结果改进KNN算法的方法,首先将训练集文本采用DBSCAN算法聚进行聚类,将训练集文本分为若干个簇,然后采用KNN算法对测试文档进行测试,最后用距离最近的n个簇中的若干训练集文本使用KNN算法...
关键词:KNN算法 DBSCAN算法 训练集 
一种改进的文本分类特征选择算法
《微电子学与计算机》2011年第12期180-183,共4页陈建华 王治和 蒋芸 许虎寅 樊东辉 
国家自然科学基金(60873196);甘肃省科技计划(甘肃省自然科学基金项目1010RJZA022);西北师范大学2010年第三期知识与创新工程科研骨干项目(nwnu-kjcxgc-03-67)
现有的一种特征选择算法DPM(Discriminating Power Measure)[1],是通过计算每个特征在某一类别和剩余其他类别中的文档频,比较了特征对一个类别和对其他类别的贡献,提取出具有强类别区分能力的特征词.在研究此特征选择算法的基础上,提...
关键词:特征选择 DPM 文档频 词频 
高校家庭经济困难学生认定系统的设计与实现被引量:3
《电脑知识与技术》2011年第1期132-134,共3页许虎寅 王治和 陈建华 樊东辉 
为解决当前高校家庭经济困难学生认定J-作中的诸多困难.文章使用visual c#开发语言和SQL server数据库.在.net框架下设计并实现了基于B/S模式的高校家庭经济困难学生认定系统,对高校学生家庭经济状况进行定量和定性分析,采用工作...
关键词:ASP.NET 高校家庭经济困难学生 认定系统 困难分数 评议分数 
检索报告 对象比较 聚类工具 使用帮助 返回顶部