一种基于聚类模式的RDF数据聚类方法  被引量:3

Cluster Pattern Based RDF Data Clustering Method

在线阅读下载全文

作  者:袁柳[1] 张龙波[2] 

机构地区:[1]陕西师范大学计算机科学学院,西安710062 [2]山东理工大学计算机科学与技术学院,淄博255049

出  处:《计算机科学》2015年第10期266-270,296,共6页Computer Science

基  金:国家自然科学基金项目:云计算环境下旅游信息个性化服务模型研究(41271387)资助

摘  要:如何有效管理并利用日益庞大的RDF数据是当今Web数据管理领域面临的挑战之一。对大规模的RDF数据集进行聚类操作从而得到数据集的有效划分是RDF数据存储和应用时通常采取的策略。针对现有RDF聚类过程中忽略RDF三元组自身模式特征的问题,在对RDF聚类结果的形式深入分析的基础上,定义了3种不同类型的聚类模式,从而提出基于模式的聚类方法。通过对RDF数据集的重新描述,自动生成适用于RDF数据集特征的聚类模式,在此基础上实现数据聚类的任务。在不同测试集上的实验结果验证了所提方法的正确性和有效性。How to manage and exploit the large mount of RDF dataset availably has become a vital issue in Web data management field. In order to partition the large scale RDF dataset for efficient data processing, clustering is usually adopted. The related researches tend to use classical clustering methods, and neglect the structure features of RDF tri- ples. This paper analyzed the RDF clustering results intensively, and defined three types of cluster patterns. Based on the cluster patterns,a novel RDF data clustering strategy was proposed. By redescribing the RDF dataset, the cluster patterns can be generated automatically. The experiments on different test benches prove the accuracy and efficiency of the new method.

关 键 词:聚类 开放关联数据 聚类模式 

分 类 号:TP311.1[自动化与计算机技术—计算机软件与理论]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象