检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
作 者:张振亚[1] 王进[2] 程红梅[3] 王煦法[2]
机构地区:[1]中国科学技术大学电子工程与信息科学系,合肥230027 [2]中国科学技术大学计算机系,合肥230027 [3]安徽师范大学数学系,芜湖241000
出 处:《计算机科学》2005年第9期160-163,共4页Computer Science
基 金:中国博士后科学基金(2004036463)
摘 要:基于相似度的数据空间索引在数据挖掘及数据可视化等方面有着重要的应用。本文以新闻的标题为研究对象,提出了以 CrossAVL为基础的文本对象层次式聚类方法以及文本信息空间索引算法 FastMap-MDS,有效地保持了文本对象间的相似信息。实验表明,该方法具有较高的效率和精度。Spatial index for data based on similarity can be employed by applications on data mining and data visualization widely. To build spatial index of news title, this paper implements hierarchical cluster algorithm for news titles with CrossAVL as data structure for the similarity matrix storing and presents an available and efficiency method named as FastMap-MDS. Experiment results show that this method can work efficiently while the similarity information are kept well.
关 键 词:余弦相似度 数据空间 索引方法 数据挖掘 数据可视化 数据库
分 类 号:TP311.13[自动化与计算机技术—计算机软件与理论]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:3.148.192.32