WEB文档聚类

作品数:21被引量:97H指数:5
导出分析报告
相关领域:自动化与计算机技术更多>>
相关作者:杨瑞龙李卫华谢洪涛冯志勇王子兴更多>>
相关机构:华中科技大学重庆大学清华大学天津大学更多>>
相关期刊:《中文信息学报》《系统仿真学报》《管理学报》《计算机工程与设计》更多>>
相关基金:国家科技支撑计划安徽省自然科学基金四川省重点科技攻关项目国家重点基础研究发展计划更多>>
-

检索结果分析

结果分析中...
条 记 录,以下是1-10
视图:
排序:
基于遗传算法的Web文档聚类算法被引量:4
《现代电子技术》2016年第1期148-152,共5页马艳英 
吉林省教育科学"十二五"规划课题:应用型大学建设背景下大学生数学素养培养研究(GH150526);吉林工程技术师范学院校级课题:基于多元统计分析方法的矿产预测方法研究及应用(2015);2014年校级课题:应用型背景下<高等数学>教学模式的研究
考虑到传统Web文档聚类算法聚类效果差、速度慢等问题,针对Web文档聚类算法进行深入研究,使用目标优化策略将Web文档聚类认为是最佳划归文档集合的范畴,并通过引入优化算法进行聚类划分。针对使用SVD表示的Web文档向量存在高维稀疏性等...
关键词:WEB文档聚类 遗传算法 自适应对偶种群 目标策略 
基于GA与PSO混合优化的Web文档聚类算法被引量:5
《小型微型计算机系统》2013年第7期1531-1533,共3页黄发良 苏毅娟 
国家自然科学基金项目(61170131)资助;科学计算与智能信息处理广西高校重点实验室开放基金项目(GXSCIIP201212)资助;教育部人文社会科学研究青年基金项目(12YJCZH074)资助;福建省教育厅科技项目(JB11037)资助;福建师范大学优秀青年骨干教师培养基金项目(fjsdjk2012082)资助
Web文档聚类是web数据挖掘的重要任务之一,针对Web文档向量空间的高维性与数据聚类问题的最优化性质,采用LDA对文档向量空间进行降维,提出运用混合优化算法GA_PSO在此低维空间进行寻优,来发现Web文档集的最优簇结构.通过在真实数据集20N...
关键词:遗传算法 粒子群优化 混合优化 WEB文档聚类 
结合差分进化与K均值的Web文档聚类算法研究被引量:1
《聊城大学学报(自然科学版)》2012年第1期93-97,共5页姜凯 左风朝 
山东省教育厅科技计划项目资助(J08LJ59)
为解决文档聚类问题,提出一种基于差分进化的聚类算法,通过把文档聚类问题建模为优化问题,对聚类准则函数进行优化,来寻找初始最优聚类中心.在此基础上,进一步提出两种差分进化算法与K均值结合的混合方法,来获得更好的聚类结果.实验表明...
关键词:WEB文档聚类 差分进化算法 K均值 优化问题 
一种新的加权后缀树Web文档聚类方法被引量:2
《系统仿真学报》2011年第3期474-479,共6页杨瑞龙 朱庆生 谢洪涛 屈洪春 
国家科技支撑计划(2007BAH08B04);重庆市科技支撑计划(2008AC20084)
针对Web文档的结构及其特征,提出了一种新的加权后缀树聚类方法WSTC。首先,根据Web文档的HTML标签,把文档划分为具备不同重要性等级的段,段划分成句子,句子分割为词。其次,用句子替代文档构造后缀树,把其重要性等级作为结构权融入后缀...
关键词:后缀树 后缀树聚类 WEB文档聚类 Web文档结构 权重计算 
融合SOM和改进PSO的Web文档集成聚类算法被引量:2
《计算机工程与应用》2010年第34期111-114,共4页宋剑杰 王伟 
随着信息的爆炸式增长,现有的搜索引擎在很多方面不能满足人们的需要。Web文档聚类可以减小搜索空间,加快检索速度,提高查询精度。提出了一种融合SOM(Self-Organizing Maps)粗聚类和改进PSO(Particle Swarm Optimization)细聚类的Web文...
关键词:WEB文档聚类 自组织特征映射 粗聚类 改进PSO算法 细聚类 集成聚类算法 
快速混合Web文档聚类被引量:3
《计算机工程与应用》2010年第22期12-15,共4页杨瑞龙 朱庆生 谢洪涛 
国家科技支撑计划No.2007BAH08B04;重庆市科技支撑计划No.2008AC20084~~
提出了一种使用后缀树聚类算法优化K-means文档聚类初始值的快速混合聚类方法STK-means。该方法首先构建文档集的后缀树模型,使用后缀树聚类算法识别初始聚类、提取K-means聚类算法初始值中心值。然后,把后缀树模型的节点映射到M维向量...
关键词:聚类算法 K-MEANS算法 后缀树 WEB文档聚类 基于短语的相似度 
基于语义相似度的Web文档聚类算法被引量:3
《合肥工业大学学报(自然科学版)》2009年第12期1846-1850,共5页李毅 王浩 杨静 
安徽省自然科学基金资助项目(070412064);合肥工业大学科学研究发展基金资助项目(062101f)
文章提出基于语义相似度的Web文档聚类算法——WDCSS算法,依据文档关键词之间的相似度生成最小树,通过概率统计来确定最小树中相似度阈值,并对最小树中进行切割,同时对较小的子类进行划分合并。实验表明,WDCSS不仅能为具有各种不同聚类...
关键词:WEB文档聚类 语义相似度 聚类算法 最小树 
基于频繁项集的Web文档聚类的应用改进
《现代计算机》2009年第10期11-13,共3页汪继文 汪磊锋 韩超 
安徽省自然科学基金项目(No.070412051)
利用一种基于十字链表快速挖掘频繁项集的算法代替传统算法产生频繁项集,改进基于频繁项集的文档聚类方法在web文档上的应用。通过与传统算法的分析比较,此种方法应用改进是可行的,使整个方法应用性能更好。
关键词:频繁项集 文档聚类 WEB文档 十字链表 
基于自适应谐振理论的Web文档聚类集成方法被引量:1
《西南交通大学学报》2009年第1期26-31,共6页杨燕 靳蕃 Kamel Mohamed 
四川省重大应用基础研究资助项目(04JY029-001-4)
提出了基于自适应谐振理论的Web文档聚类集成方法.该方法先用蚁群算法对Web文档进行聚类,再用ART神经网络对聚类结果集成.实验结果表明,集成后的聚类综合质量高于集成前的聚类综合质量.
关键词:自适应谐振理论 聚类集成 蚁群聚类算法 WEB文档 
基于Web日志挖掘的Web文档聚类被引量:5
《计算机工程与设计》2008年第18期4708-4710,共3页高哲 魏海平 王福威 赵晓碧 
Web日志挖掘是Web挖掘的一种,介绍了Web日志挖掘的一般过程,研究了k-means聚类算法,并分析了k-means聚类算法的不足。k-means聚类算法迭代过程中每次都需要计算每个数据对象到簇质心的距离,使得聚类效率不高,针对这个问题,提出了k-mean...
关键词:日志挖掘 WEB日志 K-MEANS 文档聚类 日志预处理 
检索报告 对象比较 聚类工具 使用帮助 返回顶部