基于中文短信文本聚类的热点事件发现  被引量:4

Hot Events Detection Based on Chinese SMS Text Clustering

在线阅读下载全文

作  者:刘金岭[1] 王新功[1,2] 

机构地区:[1]淮阴工学院计算机工程学院淮安223003 [2]沧州师范学院计算机系沧州061001

出  处:《情报杂志》2013年第2期30-33,共4页Journal of Intelligence

基  金:河北省科技支撑计划项目“垃圾信息的预意识别”(编号:10213581);淮阴工学院重点基金项目(编号:HGA0907)资助

摘  要:随着通信事业的快速发展,短信文本信息量非常巨大,乃至亿级,同时大类别短信文本中隐含着热点事件。现有聚类算法对海量短信文本进行聚类分析显得力不从心。利用短信文本在给定时间段中的内聚性,对待聚类的短信文本进行排序,并在聚类过程中清除孤立信息和小类别短信文本。实验表明,对于海量短信文本的大类别聚类效率是非常高的。With the rapid development of telecommunication industry, SMS text such as query logs and SMS text messages play an in- creasingly important role in our dally life, and there are hidden hot events in large size class of Chinese SMS text. Most existing clustering methods are hard to be applied in dealing with this kind of information due to the huge scale of data. Using SMS text cohesion in a given time period, the clustering of SMS text is sorted and isolated information and small set SMS text are removed in the clustering process. The experiments show that the clustering efficiency of the large size class for mass SMS text is very high.

关 键 词:大类别 短信文本聚类方法热点事件 

分 类 号:G206.3[文化科学—传播学]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象