基于余弦相似度的文本空间索引方法研究  被引量:55

An Approach for Spatial Index of Text Information Based on Cosine Similarity

在线阅读下载全文

作  者:张振亚[1] 王进[2] 程红梅[3] 王煦法[2] 

机构地区:[1]中国科学技术大学电子工程与信息科学系,合肥230027 [2]中国科学技术大学计算机系,合肥230027 [3]安徽师范大学数学系,芜湖241000

出  处:《计算机科学》2005年第9期160-163,共4页Computer Science

基  金:中国博士后科学基金(2004036463)

摘  要:基于相似度的数据空间索引在数据挖掘及数据可视化等方面有着重要的应用。本文以新闻的标题为研究对象,提出了以 CrossAVL为基础的文本对象层次式聚类方法以及文本信息空间索引算法 FastMap-MDS,有效地保持了文本对象间的相似信息。实验表明,该方法具有较高的效率和精度。Spatial index for data based on similarity can be employed by applications on data mining and data visualization widely. To build spatial index of news title, this paper implements hierarchical cluster algorithm for news titles with CrossAVL as data structure for the similarity matrix storing and presents an available and efficiency method named as FastMap-MDS. Experiment results show that this method can work efficiently while the similarity information are kept well.

关 键 词:余弦相似度 数据空间 索引方法 数据挖掘 数据可视化 数据库 

分 类 号:TP311.13[自动化与计算机技术—计算机软件与理论]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象