一种不确定性数据频繁模式的垂直挖掘算法  被引量:12

Mining Frequent Patterns from Uncertain Data in a Vertical Way

在线阅读下载全文

作  者:张李一[1] 张守志[1] 施伯乐[1] 

机构地区:[1]复旦大学计算机科学技术学院,上海200433

出  处:《小型微型计算机系统》2012年第2期206-209,共4页Journal of Chinese Computer Systems

摘  要:由于数据的不确定性,传统频繁模式挖掘方法难以适用到不确定性数据中.针对不确定性数据的特点,把挖掘确定性数据频繁模式的经典垂直挖掘算法Eclat算法扩展到不确定性数据中,提出了UP-Eclat算法.该算法分别对Tid集和项集搜索树进行扩展:把原来只有一个id域的Tid扩展成两个域,即id域和概率域;用扩展后的Tid集代替原来的Tid集,生成扩展后的项集搜索树.扩展后的Tid集可以表示不确定性数据,然后利用扩展后的项集搜索树进行频繁模式挖掘.通过实验与分析,UP-Eclat算法可行,高效.Because of the uncertainty, the traditional way of mining frequent patterns is not available in uncertain data. As a result, this paper extends the classic vertical mining algorithm Eclat for mining frequent pattems from uncertain data and then proposes UP- Eclat algorithm. This algorithm extends the tidset as well as the itemset search tree. The Tid that contains only one id field is extended to a new Tid that contains both id field and probability field. Then the extended itemset search tree is consisted of the new tidset. The extended ddset can describe uncertain data, and the extended itemset search tree is built to mine the frequent patterns. The UP-Eclat algorithm is proved to be efficient according to the experimentation.

关 键 词:不确定性数据 数据挖掘 频繁模式 垂直挖掘 

分 类 号:TP391[自动化与计算机技术—计算机应用技术]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象