基于PAM概率主题模型的微博热点挖掘  被引量:3

PAM-based microblog hot spot mining

在线阅读下载全文

作  者:余淼淼[1] 周志平[1] 赵晓东[1] 岳晓冬[2] 

机构地区:[1]同济大学企业数字化技术教育部工程研究中心,上海201804 [2]上海大学计算机工程与科学学院,上海200444

出  处:《微型机与应用》2013年第15期86-89,共4页Microcomputer & Its Applications

基  金:国家自然科学基金项目(61105047);国家科技支撑计划课题(2012BAF10B12)

摘  要:针对微博本身的语言特点,提出采用PAM(Pachinko Allocation Model)这种能够提取文本隐含主题的产生式模型,对微博的非结构化文本信息进行热点提取。采用吉布斯抽样方法计算模型参数,获取微博热点的分类分析以及关键词。在真实数据集上的实验表明,PAM模型能够有效地对微博热点进行挖掘。Targeting at solving the above problem, with considering the linguistic characteristics of microblog, a PAM -basedapproach is proposed to automatically recognize the hotspot from the unstructured text information of microblog. Gibbs sampling isused to calculate the PAM model parameters. And then the classified hot spot and key words can be extracted. Experimental resultson the dataset show that the PAM probability topic model can offer an effective solution to hot spot mining for microblog.

关 键 词:PAM 吉布斯抽样 微博 热点挖掘 

分 类 号:TP18[自动化与计算机技术—控制理论与控制工程]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象