海量活动轨迹相似查询  

Towards similarity search for massive activity trajectories

在线阅读下载全文

作  者:刘勇[1] 覃飙[1] 余萝 

机构地区:[1]中国人民大学信息学院,北京100872

出  处:《计算机工程与应用》2015年第14期99-103,145,共6页Computer Engineering and Applications

基  金:国家自然科学基金(No.61170012);江苏省未来网络创新研究院未来网络前瞻性研究项目;中国人民大学明德青年学者培育资助项目(No.10XNJ048)

摘  要:活动轨迹的近似查询是在带关键词信息的轨迹集中,检索与查询点集距离最近且满足查询点集关键词要求的活动轨迹的过程。因为GAT(Grid index for Activity Trajectories)不能查询海量活动轨迹,将GAT扩展到适用于海量活动轨迹的近似查询技术GATH(GAT on Hadoop)。和GAT相比,GATH使用两种新的索引结构进行剪枝;其网格索引依照海量数据的特点从底层单元格开始进行基于空间的剪枝;其倒排索引用于进行基于关键词的剪枝。实验结果证实GATH比GAT能有效缩短索引建立时间及提高剪枝效率。Given a sequence of query locations, each associated with a set of key activities, an activity trajectory similarity query returns k trajectories that cover the query activities and yield the shortest minimum match distance. Since GAT(Grid index for Activity Trajectories)is not for big data, it introduces a new structure GATH(GAT on Hadoop)to solve the problem of similarity search on massive activity trajectories. Moreover, GATH uses grid index for space pruning and inverted index for keyword pruning. The experimental results demonstrate that GATH is more efficient for both index building and data pruning than GAT.

关 键 词:海量数据 活动轨迹 海量活动轨迹的网格索引(GATH) 近似查询 

分 类 号:TP391[自动化与计算机技术—计算机应用技术]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象