一种挖掘不确定数据频繁模式的深度优先算法  被引量:1

A Depth-First Search Algorithm for Mining Frequent Patterns from Uncertain Data

在线阅读下载全文

作  者:徐赛赛[1] 谈飞 简玲[1] 邱卫东[3] 

机构地区:[1]上海市公安局网络安全保卫总队 [2]上海数据分析与处理技术研究所 [3]上海交通大学信息安全工程学院

出  处:《微型电脑应用》2015年第10期62-64,68,共4页Microcomputer Applications

摘  要:随着信息技术日新月异的发展,在金融、物流以及天体研究等众多领域,时刻都会产生和记录海量的数据。而多数情况下,这些数据都存在着误差或者仅是部分完整的,数据的不确定性导致传统的数据挖掘方法不再适用于不确定数据。因而提出了一种基于垂直结构的不确定数据频繁模式挖掘算法Pro Eclat。Pro Eclat采用数据集的垂直格式表示,避免了对数据集的多次扫描,使用两阶段模型的频繁项集判断方式,大幅提高了计算效率。实验证明,Pro Eclat伸缩性良好,性能优于同类算法。With the rapid development of information technology,vast amounts of data and records are produced in areas like finance,logistics and astronomy.In most cases,the data exist errors or may only be partially complete.Because of the uncertainties in the data,the traditional data mining methods are no longer suitable for mining uncertain data.This paper presents a frequent pattern of uncertain data mining algorithm ProEclat,which is based on vertical structure.ProEclat uses the vertical format of dataset,thus avoiding multiple scans.Moreover,in order to improve computational efficiency,a two-stage model is applied to judge whether a candidate set is frequent quickly.The result of experiments shows that ProEclat is scalable and performs better than similar algorithms.

关 键 词:数据挖掘 不确定数据 深度优先 频繁模式 

分 类 号:TP301.6[自动化与计算机技术—计算机系统结构]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象