微博用户兴趣主题抽取方法  被引量:3

A Method of Micro-Blog Users' Interests Topic Extraction

在线阅读下载全文

作  者:杨仁凤 陈端兵[1,2] 谢文波 YANG Ren-feng;CHEN Duan-bing;XIE Wen-bo(School of Computer Science and Engineering,University of Electronic Science and Technology of China Chengdu 611731;Big Data Research Center,University of Electronic Science and Technology of China Chengdu 611731)

机构地区:[1]电子科技大学计算机科学与工程学院,成都611731 [2]电子科技大学大数据研究中心,成都611731

出  处:《电子科技大学学报》2018年第4期633-640,共8页Journal of University of Electronic Science and Technology of China

基  金:国家自然科学基金(61433014;61673085);中央高校基本科研业务费专项资金(ZYGX2014Z002)

摘  要:根据社交媒体短文本特征改进了词袋模型,利用特征之间的语义关系提出了语义表示模型,采用句子中特征先后顺序构建了次序图模型,在此基础上引入时间因素,提出了基于Single-Pass算法的用户兴趣主题模型用于抽取微博用户关注的话题。实验结果表明,该方法的FM、AA和F指标相比FSC-LDA方法分别提高了200.40%、46.50%、80.05%。The bag of word model is first improved according to the social media short text feature. The semantic representation model is then proposed by using semantic relations between features. The sequence diagram model can be constructed by using the sequence of features in the sentence. On the base of these, together with time factor, we propose a user interest topic mode based on Single-Pass to extract the topic of user's attention. The experimental results show that the FM, AA and F of our method are increased by 200.40%, 46.50% and 80.05%, respectively, compared with the latest method FSC-LDA.

关 键 词:兴趣抽取 微博 Single-Pass 文本聚类 主题模型 

分 类 号:TP181[自动化与计算机技术—控制理论与控制工程]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象