多粒度时间文本数据的周期模式挖掘算法  被引量:1

Periodicity Algorithm of Textual Data Mining with Multi-granularity Time

在线阅读下载全文

作  者:孟志青[1] 楼婷渊[1] 胡强[1] 

机构地区:[1]浙江工业大学经贸管理学院,杭州310023

出  处:《计算机科学》2013年第11A期251-254,262,共5页Computer Science

摘  要:大规模文本数据挖掘是大数据分析的重要分支,也是近年来的一个研究热点。研究了多粒度时间文本数据周期模式挖掘算法,首先提出了时间粒度转换、多粒度时间间隔等概念,然后建立了文本数据的周期模型,给出了一个多粒度时间文本下的周期模式挖掘算法,最后对大量病毒文本文献数据进行了实验,表明了提出的算法可以挖掘一些有效的周期模式,讨论了周期宽松度对支持度和置信度的影响。该研究为大文本数据分析提供了一种新的方法。The large-scale text data mining is an important branch of the big data analysis and is also a hot research topic in recent years. This paper studied algorithm of the textual periodicity data mining with multi-granularity time. First, the concepts of granularity conversion and multi-granularity time interval were presented. Then, a periodic pattern of textual data and an algorithm of the periodic pattern to textual data with multi-granularity time were proposed. Finally, by testing virus textual data, the proposed algorithm shows that some efficient periodic patterns are obtained. The influence of the periodic range on the degree of support and confidence were discussed. This paper provided a new method for the big text data analysis.

关 键 词:多粒度时间 文本数据 数据挖掘 周期模式 

分 类 号:TP311[自动化与计算机技术—计算机软件与理论]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象