国家高技术研究发展计划(2006AA01Z230)

作品数:4被引量:85H指数:4
导出分析报告
相关作者:彭京唐世渭杨冬青唐常杰乔少杰更多>>
相关机构:北京大学成都市公安局四川大学教育部更多>>
相关期刊:《中国科学:信息科学》《计算机学报》更多>>
相关主题:概念相似度内积空间基于语义内积文本聚类算法更多>>
相关领域:自动化与计算机技术更多>>
-

检索结果分析

结果分析中...
条 记 录,以下是1-4
视图:
排序:
基于概念相似度的文本相似计算被引量:17
《中国科学(F辑:信息科学)》2009年第5期534-544,共11页彭京 杨冬青 唐世渭 王腾蛟 高军 
中国博士后科学基金(批准号:20060400002);四川省青年科技基金(批准号:07ZQ026-55;08ZQ026-016);国家自然科学基金(批准号:60473051;60503037);国家高技术研究发展计划(批准号:2006AA01Z230);北京市自然科学基金(批准号:4062018)资助项目
根据概念相似信息,文中提出了一种新的文本相似度计算方法.新方法首先将文本转换为词向量空间模型,然后将词分解为概念集合,通过计算概念间的内积空间,得到词之间的相似度,最后根据词之间的相似度,计算文本相似性.文中的主要工作包括:1...
关键词:概念相似度 相似计算 向量空间 内积空间 
一种基于语义内积空间模型的文本聚类算法被引量:45
《计算机学报》2007年第8期1354-1363,共10页彭京 杨冬青 唐世渭 付艳 蒋汉奎 
国家自然科学基金(6473051;60503037);中国博士后科学基金(20060400002);四川省青年科技基金(2007Q14-055);国家"八六三"高技术研究发展计划项目基金(2006AA01Z230);北京市自然科学基金(4062018)资助~~
现有数据聚类方法在处理文本数据,尤其是短文本数据时,由于没有考虑词之间潜在存在的相似情况,因此导致聚类效果不理想.文中针对文本数据高维度和稀疏空间的特点,提出了一种基于语义内积空间模型的文本聚类算法.算法首先利用内积空间的...
关键词:内积空间 文本聚类 概念相似度 相似计算 数据挖掘 
基于重叠表达的多基因进化算法被引量:14
《计算机学报》2007年第5期775-785,共11页彭京 唐常杰 元昌安 朱明放 乔少杰 
国家自然科学基金(60473071;60473051;60503037);中国博士后科学基金(20060400002);四川省青年科技基金(07ZQ026-055);国家"八六三"高技术研究发展计划项目基金(2006AA01Z230);四川省重点科技计划项目(04SG1640)资助.
受生物基因片段重叠表达现象的启发,文中提出了一种新的基于重叠表达进化算法——MEOE(Multigene Evolutionary algorithm based on Overlapped Expression).文章具体描述了MEOE的基因表达结构及相应的算法.不同于已有的工作,在M...
关键词:基因表达式编程 进化算法 基因重叠 表达空间 
一种基于层次距离计算的聚类算法被引量:11
《计算机学报》2007年第5期786-795,共10页彭京 唐常杰 程温泉 石葆梅 乔少杰 
国家自然科学基金(60473071;60473051;60503037);中国博士后科学基金(20060400002);四川省青年科技基金(07ZQ026-055);国家"八六三"高技术研究发展计划项目基金(2006AA01Z230);北京市自然科学基金(4062018)资助.
针对广泛存在的层次编码型数据类型,提出了层次距离的新概念,证明了相关的数学性质,并在此基础上提出并实现了新的基于层次距离计算的聚类算法HDCA(Hierarchy Distance Computing based clustering Algo-rithm).新方法克服了传统聚类算...
关键词:聚类 层次距离 层次编码变量 k-中心 数据挖掘 
检索报告 对象比较 聚类工具 使用帮助 返回顶部