北京市自然科学基金(4062018)

作品数:4被引量:75H指数:4
导出分析报告
相关作者:彭京唐世渭杨冬青蒋汉奎付艳更多>>
相关机构:成都市公安局北京大学教育部四川大学更多>>
相关期刊:《计算机学报》《中国科学:信息科学》更多>>
相关主题:概念相似度内积空间基于语义内积文本聚类算法更多>>
相关领域:自动化与计算机技术更多>>
-

检索结果分析

结果分析中...
条 记 录,以下是1-4
视图:
排序:
基于概念相似度的文本相似计算被引量:17
《中国科学(F辑:信息科学)》2009年第5期534-544,共11页彭京 杨冬青 唐世渭 王腾蛟 高军 
中国博士后科学基金(批准号:20060400002);四川省青年科技基金(批准号:07ZQ026-55;08ZQ026-016);国家自然科学基金(批准号:60473051;60503037);国家高技术研究发展计划(批准号:2006AA01Z230);北京市自然科学基金(批准号:4062018)资助项目
根据概念相似信息,文中提出了一种新的文本相似度计算方法.新方法首先将文本转换为词向量空间模型,然后将词分解为概念集合,通过计算概念间的内积空间,得到词之间的相似度,最后根据词之间的相似度,计算文本相似性.文中的主要工作包括:1...
关键词:概念相似度 相似计算 向量空间 内积空间 
A new similarity computing method based on concept similarity in Chinese text processing被引量:4
《Science in China(Series F)》2008年第9期1215-1230,共16页PENG Jing YANG DongQing TANG ShiWei WANG TengJiao GAO Jun 
Supported by the China Postdoctoral Science Foundation (Grant No. 20060400002);the Sichuan Youth Science and Technology Foundation of China (Grant No. 08JJ0109);the National Natural Science Foundation of China (Grant Nos.60473051, 60503037);the National High-tech Re- search and Development of China (Grant No. 2006AA01Z230);the Natural Science Foundation of Beijing Natural Science Foundation (Grant No. 4062018)
The paper proposes a new text similarity computing method based on concept similarity in Chinese text processing. The new method converts text to words vector space model at first, and then splits words into a set of ...
关键词:concept similarity similarity computing vector space inner product space 
一种基于语义内积空间模型的文本聚类算法被引量:45
《计算机学报》2007年第8期1354-1363,共10页彭京 杨冬青 唐世渭 付艳 蒋汉奎 
国家自然科学基金(6473051;60503037);中国博士后科学基金(20060400002);四川省青年科技基金(2007Q14-055);国家"八六三"高技术研究发展计划项目基金(2006AA01Z230);北京市自然科学基金(4062018)资助~~
现有数据聚类方法在处理文本数据,尤其是短文本数据时,由于没有考虑词之间潜在存在的相似情况,因此导致聚类效果不理想.文中针对文本数据高维度和稀疏空间的特点,提出了一种基于语义内积空间模型的文本聚类算法.算法首先利用内积空间的...
关键词:内积空间 文本聚类 概念相似度 相似计算 数据挖掘 
一种基于层次距离计算的聚类算法被引量:11
《计算机学报》2007年第5期786-795,共10页彭京 唐常杰 程温泉 石葆梅 乔少杰 
国家自然科学基金(60473071;60473051;60503037);中国博士后科学基金(20060400002);四川省青年科技基金(07ZQ026-055);国家"八六三"高技术研究发展计划项目基金(2006AA01Z230);北京市自然科学基金(4062018)资助.
针对广泛存在的层次编码型数据类型,提出了层次距离的新概念,证明了相关的数学性质,并在此基础上提出并实现了新的基于层次距离计算的聚类算法HDCA(Hierarchy Distance Computing based clustering Algo-rithm).新方法克服了传统聚类算...
关键词:聚类 层次距离 层次编码变量 k-中心 数据挖掘 
检索报告 对象比较 聚类工具 使用帮助 返回顶部