检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
作 者:陈灿[1]
机构地区:[1]中国科学院计算机网络信息中心,北京100190
出 处:《科研信息化技术与应用》2016年第4期3-8,共6页E-science Technology & Application
基 金:中国科学院计算机网络信息中心主任基金项目(CNIC_ZR_201503)
摘 要:小尺度区域生态调查历史数据常出现地名的同地异名现象,单纯依靠地学距离,难以将小尺度区域不同调查区进行准确聚类。为此,我们引入中文语义,通过组合使用中文语义距离和地学距离,改进DBSCAN聚类算法,从而能够对较小尺度区域的历史数据进行按照调查区的聚类。实验证明,所提算法可以较好的将小尺度区域的生态调查数据进行聚类,为后续数据分析提供了可能。The historical data obtained by the small-scale region ecological survey often contains different names for the same location. It is difficult to cluster different survey regions in the small-scale region by means of the geographical distance. We improved the DBSCAN clustering algorithm by using Chinese semantics and geographical distance jointly for clustering the historical data based on survey regions. The experiments show that the algorithm can achieve better clustering and facilitate the subsequent data analysis.
关 键 词:生态调查数据 聚类算法 DBSCAN算法 中文语义 地学距离
分 类 号:TP391.41[自动化与计算机技术—计算机应用技术]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:216.73.216.3