检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
机构地区:[1]福州大学数学与计算机科学学院,福建福州350108
出 处:《中国科学技术大学学报》2017年第10期823-836,共14页JUSTC
基 金:国家自然科学基金(61300104);福建省科技拥军基金(JG2014001);福建省自然科学基金(2012J01168);福州大学科技发展基金(2013-XQ-32)资助
摘 要:现有的RDF关键词搜索方法主要是在大规模的RDF数据图上直接进行搜索,未能充分利用RDF本体中的语义信息,迭代次数过多造成搜索效率和效果不理想.针对这些问题,借助Redis内存数据库集群,提出分布式RDF关键词近似搜索算法(DKASR),即在分布式平台上实现大规模数据的并行搜索.算法结合RDF本体的语义信息构建本体子图,利用语义评分函数对本体子图进行排序,借助MapReduce计算模型实现并行搜索并返回Top-k结果;如果返回的结果没有达到Top-k,则对本体子图进行扩展生成近似本体子图,使用语义相似度函数对近似本体子图进行排序,再利用MapReduce计算模型实现并行搜索,直到返回Top-k结果.实验结果表明,DKASR算法能够高效正确地实现RDF关键词近似搜索并有效返回Top-k结果.Existing RDF keyword search methods mainly search on the large-scale RDF data graph directly and do not make full use of the semantic information in the RDF ontology.Too many iterations lead to unfavorable search efficiency and unsatisfactory results.To solve these problems,a distributed keyword approximate search algorithm(DKASR)for RDF based on Redis memory database cluster was proposed and the parallel search of large-scale data on the distributed platform was realized.The algorithm constructs ontology sub-graphs by using the semantic information of RDF ontology,uses the semantic scoring function to sort ontology sub-graphs,and searches and returns the Top-kresults concurrently with the aid of MapReduce computation model.If the results do not meet Top-k,ontology sub-graphs are extended to generate approximate ontology sub-graphs and the semantic similarity function is used to sort approximate ontology sub-graphs.Then,MapReduce computation model was used to realize the parallel search until the results meet Top-k.Finally,the results of experiments show that the DKASR algorithmcan realize the RDF keyword approximate search and return the Top-k results efficiently and accurately.
关 键 词:RDF 关键词 近似搜索 REDIS MAPREDUCE
分 类 号:TP391[自动化与计算机技术—计算机应用技术]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:216.73.216.80