检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
机构地区:[1]陕西师范大学计算机科学学院,西安710062 [2]山东理工大学计算机学院,淄博255049
出 处:《计算机科学》2016年第9期91-98,共8页Computer Science
基 金:国家自然科学基金项目:云计算环境下旅游信息个性化服务模型研究(41271387);中央高校基本科研业务费专项资金:模式级链接开放关联数据集上的数据挖掘关键技术研究(GK201503066)资助
摘 要:针对关联数据集合呈现出的大数据特性和蕴含的语义信息,提出了首先建立关联数据集的模式级链接,再进行关联规则挖掘的方法。在同领域RDF数据集上定义RDF数据项模式并提出数据项模式的产生规则;利用RDF数据查询技术从数据项模式获得RDF数据项集合,进而再推导出特定领域内的关联规则。提出的基于关联数据RDF数据项模式的关联规则挖掘方法将关联规则挖掘扩展到同一领域内的数据集合而不再局限于单一数据集,同时给出了基于Hadoop的大规模RDF数据集上的关联规则挖掘的实现方案。实验结果验证了模式级链接对于关联规则挖掘的价值和所提方法的有效性。A schema-level interconnected association rules mining method for large scale associated data was proposed based on the semantic information implied in the associated data set. Instead of mining association rules from separated RDF data sets directly, firstly, we established schema-level linkage between different data sets. The RDF data item pat- tern generation rules are defined based on the schema-level linked datasets and then the RDF data query techniques are exploited for constructing RDF data items sets. The proposed data item patterns generation rules can extend the data mining objects from a single data set to multi-datasets in the same domain. A Hadoop based implementation plan of as- sociation rules mining was designed. The experiment results prove the value of establishing schema-level linkage on linked data and the effectiveness of the proposed method.
分 类 号:TP311.1[自动化与计算机技术—计算机软件与理论]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:216.73.216.117