后缀树算法在舆情聚类中的应用  被引量:1

Application of STC algorithm to internet public opinions clustering

在线阅读下载全文

作  者:彭静[1] 翟英[2] 冯爽[3] 

机构地区:[1]河北科技大学信息科学与工程学院,河北石家庄050018 [2]河北经贸大学信息技术学院,河北石家庄050061 [3]河北科技大学教务处,河北石家庄050018

出  处:《河北科技大学学报》2012年第1期65-68,共4页Journal of Hebei University of Science and Technology

基  金:河北省科技支撑计划项目(10213557)

摘  要:针对网络舆情分析的需求背景,研究了通过后缀树算法发现文本文档之间的公共短语串,按公共短语串实现文档聚类。网页文档的标题和摘要能代表文档的主要思想,应用后缀树算法实现对标题和摘要自动聚类,从而实现舆情信息自动聚类。In answer to the requirement of internet opinions analysis,this paper discusses the STC algorithm for text clustering,in order to discover common phrases that can assign documents and form document clusters.Because web document titles and abstracts can express the main ideas,web document clusters are created by STC algorithm,and clusters of internet public opinions information are created by using this method.

关 键 词:网络舆情 后缀树算法 文本聚类 

分 类 号:TP3[自动化与计算机技术—计算机科学与技术]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象