基于MapReduce的海量事件日志并行转化算法  被引量:11

Parallel algorithm to convert big event log based on MapReduce

在线阅读下载全文

作  者:窦蒙[1,2,3] 闻立杰[1,2,3] 王建民[1,2,3] 闫志强[1,4] 

机构地区:[1]清华大学软件学院,北京100084 [2]清华大学信息系统安全教育部重点实验室,北京100084 [3]清华大学清华信息科学与技术国家实验室,北京100084 [4]首都经济贸易大学信息管理与信息系统系,北京100070

出  处:《计算机集成制造系统》2013年第8期1784-1793,共10页Computer Integrated Manufacturing Systems

基  金:国家自然科学基金资助项目(61003099);国家863计划资助项目(2012AA040904);教育部-中国移动科研基金资助项目(MCM20123011)~~

摘  要:随着大数据时代的来临,为了高性能地转化海量分布式日志,提出事件日志在云平台上基于MapReduce架构的分布式转化算法。提出基于案例拆分的改进算法,以转化单机上的日志,使其变得可行;进一步提出基于MapReduce的并行转化算法。这是在过程挖掘领域中首次实现从海量原始日志到可扩展事件流事件日志的并行转化,极大地提高了转化性能。With the coming of big data time, to convert the mass distributed log in high performance, a distributed conversion algorithm of event log based on MapReduce framework was proposed. An improved algorithm based on case split was put forwarded, thus the conversion of log on single machine became feasible. Furthermore, a parallel algorithm based on MapReduce was proposed. In the area of process mining, it was the first time to realize the par- allel conversion from mass original log to eXtensible Events Stream (XES) event log, and the conversion perform- ance was improved extremely.

关 键 词:大数据 事件日志 过程挖掘 映射归约 可扩展事件流 信息系统 

分 类 号:TP301[自动化与计算机技术—计算机系统结构]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象