一种改进的PrefixSpan算法及其在Web用户行为模式挖掘中的应用  被引量:6

Research on Improved PrefixSpan Algorithm and its Application in Web User Behavior Patterns Mining

在线阅读下载全文

作  者:姬浩博 王俊红[1,2] 

机构地区:[1]山西大学计算机与信息技术学院,太原030006 [2]山西大学计算机智能与中文信息处理教育部重点实验室,太原030006

出  处:《计算机科学》2016年第1期25-29,共5页Computer Science

基  金:国家自然科学基金(61202018;61305057;61303008);山西省青年科技基金(2013021018-1);山西省高等学校科技创新项目(2013102)资助

摘  要:序列模式挖掘是从序列数据库中挖掘相对时间或其他模式出现频率高的模式。针对PrefixSpan算法构造投影数据库时开销巨大、扫描效率不高的问题,通过以序列扩展代替项集进行扩展、放弃挖掘序列数小于阈值min_support的投影数据库以及直接递归局部频繁项等方式进行改进,并将改进方法应用于Web用户行为模式挖掘中,对日志记录中的规律进行分析和研究。实验分析表明,相比PrefixSpan算法,该改进算法在算法效率方面有一定的提高。Sequential pattern mining is mining relative time or other mode of high frequency from sequence databases.Based on the PrefixSpan algorithm,the paper proposed an improved adaptive algorithm to improve the problem of expensive construction projection database and low scanning efficiency,through the methods such as using sequence expanding instead of item expanding,abandoning the project databases that the number of sequence is less than min_support and so on.Then the new method was used for Web user behavior pattern mining to analyze and research log records law.Experimental results show that,compared to the PrefixSpan algorithm,the improved algorithm has been improved in the algorithm efficiency.

关 键 词:序列模式挖掘 WEB日志挖掘 PREFIXSPAN算法 

分 类 号:TP181[自动化与计算机技术—控制理论与控制工程]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象