基于预聚类技术的并行序贯模式挖掘算法  被引量:2

Pre-Clustered Sequential Pattern Mining

在线阅读下载全文

作  者:金沈杰[1] 吴绍春[1] 吴耿锋[1] 严胜祥[1] 

机构地区:[1]上海大学计算机工程与科学学院,上海200072

出  处:《计算机工程与科学》2004年第10期66-68,90,共4页Computer Engineering & Science

基  金:上海市科委"基于高性能计算的数据挖掘和知识发现"项目(01JC14002);上海市教委"第四期重点学科"项目(205153)

摘  要:本文讨论了在并行序贯模式数据挖掘方面采用“预聚类并行序贯模式挖掘”的策略,对数据序列聚类后按不同的类分布到不同的并行节点上,以减少甚至消除不必要的通讯开销,以便能够提高并行序贯模式挖掘在集群式高性能计算机上的执行效率。In this article, we present the Pre-Clustered Sequential Pattern Mining Algorithm in the parallel sequential pattern mining field. The method clusters the data sequences according to different classes and distribute the them into different parallel computing nodes. Thus it greatly reduces the unnecessary communications overhead and improves the execution efficiency of parallel sequential pattern mining on clustered high-performance computers.

关 键 词:模式挖掘 并行 聚类技术 高性能计算机 数据挖掘 算法 执行效率 序贯 开销 集群 

分 类 号:TP311.13[自动化与计算机技术—计算机软件与理论] TN911.7[自动化与计算机技术—计算机科学与技术]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象