检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
作 者:余淼淼[1] 周志平[1] 赵晓东[1] 岳晓冬[2]
机构地区:[1]同济大学企业数字化技术教育部工程研究中心,上海201804 [2]上海大学计算机工程与科学学院,上海200444
出 处:《微型机与应用》2013年第15期86-89,共4页Microcomputer & Its Applications
基 金:国家自然科学基金项目(61105047);国家科技支撑计划课题(2012BAF10B12)
摘 要:针对微博本身的语言特点,提出采用PAM(Pachinko Allocation Model)这种能够提取文本隐含主题的产生式模型,对微博的非结构化文本信息进行热点提取。采用吉布斯抽样方法计算模型参数,获取微博热点的分类分析以及关键词。在真实数据集上的实验表明,PAM模型能够有效地对微博热点进行挖掘。Targeting at solving the above problem, with considering the linguistic characteristics of microblog, a PAM -basedapproach is proposed to automatically recognize the hotspot from the unstructured text information of microblog. Gibbs sampling isused to calculate the PAM model parameters. And then the classified hot spot and key words can be extracted. Experimental resultson the dataset show that the PAM probability topic model can offer an effective solution to hot spot mining for microblog.
分 类 号:TP18[自动化与计算机技术—控制理论与控制工程]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:216.73.216.222