一种快速最大频繁序列模式挖掘算法  

A Mining Algorithm for Fast Maximal Sequential Patterns

在线阅读下载全文

作  者:常晓宇[1] 王喆[1] 徐秀娟[1] 路春一[1] 周春光[1] 

机构地区:[1]吉林大学计算机科学与技术学院,长春130012

出  处:《吉林大学学报(理学版)》2006年第4期570-574,共5页Journal of Jilin University:Science Edition

基  金:国家自然科学基金(批准号:60433020);教育部"符号计算和知识工程重点实验室"资助项目基金

摘  要:针对序列模式挖掘中,频繁子序列个数随模式长度增加而爆炸性增长的问题,提出一种从序列数据库中挖掘最大频繁序列模式的新算法(MFSPAN).MFSPAN充分利用不同序列可能具有相同前缀的性质来减少项集比较次数.在标准测试数据集上的实验结果表明了MFSPAN的有效性.This paper proposes a novel algorithm MFSPAN (maximal frequent sequential pattern mining algorithm). MFSPAN is used to mine the complete set of maximal frequent sequential patterns in sequence databases. It solves the problem that the number of frequent subsequences will increase explosively as frequent patterns become longer: because MFSPAN takes full advantage of the property that different sequences may share a common prefix to reduce itemset comparing times. Experiments on standard test data show that MFSPAN is very effective.

关 键 词:序列模式 最大序列模式 长模式 深度优先 

分 类 号:TP31[自动化与计算机技术—计算机软件与理论]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象