聚类研究

作品数:561被引量:2953H指数:24
导出分析报告
相关领域:自动化与计算机技术更多>>
相关作者:李毅刘勘戴文华章成志胡学钢更多>>
相关机构:大连理工大学西南交通大学西安电子科技大学武汉大学更多>>
相关期刊:更多>>
相关基金:国家自然科学基金国家社会科学基金中央高校基本科研业务费专项资金国家高技术研究发展计划更多>>
-

检索结果分析

结果分析中...
选择条件:
  • 期刊=计算机科学x
条 记 录,以下是1-10
视图:
排序:
融合无监督SimCSE的短文本聚类研究被引量:5
《计算机科学》2023年第11期71-76,共6页贺文灏 吴春江 周世杰 何朝鑫 
传统的浅层文本聚类方法在对短文本聚类时,面临上下文信息有限、用词不规范、实际意义词少等挑战,导致文本的嵌入表示稀疏、关键特征难以提取等问题。针对以上问题,文中提出一种融合简单数据增强方法的深度聚类模型SSKU(SBERT SimCSE K-...
关键词:短文本 深度聚类 预训练模型 降维方法 自然语言处理 
基于Doc2Vec增强特征的长文本主题聚类研究被引量:2
《计算机科学》2023年第S01期211-216,共6页陈洁 
中华女子学院科研基金(ZKY200020228)。
针对新闻长文本语义表征的难点,基于Doc2Vec文档嵌入和词向量加权方式构建增强的特征表示。利用DV-sim方法和DV-tfidf方法从文档首尾部分特定词性的内容中提取增强特征,再分别与Doc2Vec文档向量组合,形成新的全局表征。DV-sim从语义角度...
关键词:主题聚类 文本表征 Doc2Vec 词向量 HDBSCAN 
基于特征偏好的聚类研究被引量:3
《计算机科学》2015年第5期57-61,共5页方玲 陈松灿 
传统的聚类方法,如k均值和模糊c均值,通常并不区分数据特征对聚类的不同贡献或重要度,因此在面对高维数据聚类时,常会导致偏低的聚类性能,这归咎于聚类时未考虑高维数据特征间所存在的高度相关性或冗余。而通过在聚类时为每一特征引入...
关键词:聚类分析 特征偏好 特征权重 聚类依赖 二次规划 
基于潜在语义分析的Deep Web查询接口聚类研究被引量:3
《计算机科学》2013年第11期228-230,247,共4页强保华 李巍 邹显春 汪天天 吴春明 
国家自然科学基金(61163057);广西自然科学基金(2012jjAAG0063);广西可信软件重点实验室开放基金(KX201117);广西研究生科研创新项目(YCSZ2012070)资助
集成查询接口的生成是Deep Web数据集成的重要组成环节。如何对不同领域的查询接口进行有效的聚类是生成集成查询接口时需要解决的核心问题之一。针对传统的向量空间模型在Deep Web查询接口聚类时单纯依赖关键词匹配的缺点,引入潜在语...
关键词:潜在语义分析 奇异值分解 DEEP Web 查询接口聚类 
基于本体的Web页面聚类研究被引量:10
《计算机科学》2008年第9期153-155,共3页谢红薇 颜小林 余雪丽 
国家自然科学基金资助项目(60472093);山西省自然科学基金资助项目(20051035)
提出了一个基于本体的Web页面聚类系统原型,通过构建一个简单的搜索引擎并对结果进行聚类,大大节省用户发现所需信息的时间。同时将领域本体引入聚类系统中,提高了聚类效率和增强了聚类结果的可解释性。
关键词:聚类 本体 搜索引擎 向量空间模型 OWL 
基于并行遗传算法的K-means聚类研究被引量:17
《计算机科学》2008年第6期171-174,共4页戴文华 焦翠珍 何婷婷 
国家自然科学基金(No60442005,No60673040);国家社会科学基金(No06BYY029);教育部重点研究项目(No105117);湖北省教育厅科(NoD200728002)
针对传统K-means聚类算法对初始聚类中心的选择敏感,以及聚类数K难以确定的问题,提出一种基于并行遗传算法的K-means聚类方法。该方法采用一种新型的可变长染色体编码方案,随机选择样本点作为初始聚类中心形成染色体,然后结合K-means算...
关键词:并行遗传算法 可变长染色体编码 K-MEANS算法 聚类 
基于划分的XML文档聚类研究被引量:4
《计算机科学》2008年第3期183-185,共3页杨厚群 何中市 雷景生 
海南省教育厅高校科研项目(Hjkj200603)
本文在文本聚类的基础上对XML文档聚类进行了研究,对划分聚类法进行了改进,使之适合于XML文档聚类。最后通过路径划分聚类算法根据频繁结构对XML文档进行挖掘聚类,并对实验结果进行讨论。
关键词:划分聚类 数据挖掘 XML 
基于小生境混合遗传算法的文本特征词聚类研究
《计算机科学》2008年第1期202-203,223,共3页戴文华 何婷婷 焦翠珍 
咸宁学院科研重点项目(No.KZ0637);国家自然科学基金(No.60442005,No.60673040);国家社会科学基金(No.06BYY029);教育部科学技术研究重点项目(No.105117)基金资助
提出一种基于小生境混合遗传算法的文本特征词聚类方法。该方法首先采用贝叶斯语义模型对语料库进行统计分析,并以K-L距离度量特征词间的距离,然后将小生境遗传算法与K-Means算法相结合,对文本特征词进行聚类,为文本特征词聚类提供了较...
关键词:小生境 遗传算法 K—L距离 K-MEANS聚类 特征词聚类 
基于句子级最大频繁单词集的Web文档聚类研究被引量:1
《计算机科学》2007年第7期154-157,164,共5页路松峰 陈云开 袁莉 
Web文档聚类是Web挖掘的一个重要研究方向。现有的挖掘算法得到的频繁模式不仅维数高,而且不能很好反映文档表达的语义信息。为了得到更精确的聚类结果,本文提出一种基于句子级的最大频繁单词集挖掘方法来挖掘文档特征项。在此基础上,...
关键词:WEB文档聚类 粗糙集 关联规则 最大频繁单词集 
基于BP神经网络的文档聚类研究被引量:7
《计算机科学》2002年第8期93-95,共3页田萱 刘希玉 孟强 
1,引言 近年来,随着互联网的迅速发展,基于Web的数据挖掘技术受到越来越多的关注,经常用在文本挖掘和信息检索等多个领域的聚类(Clustering)技术也成为人们研究的热点.对一组实际或抽象的元素进行处理,把相似的元素归为同类的过程称之...
关键词:Internet BP神经网络 文档聚类 数据挖掘 信息检索系统 查准率 查全率 
检索报告 对象比较 聚类工具 使用帮助 返回顶部