检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
作 者:杨仁凤 陈端兵[1,2] 谢文波 YANG Ren-feng;CHEN Duan-bing;XIE Wen-bo(School of Computer Science and Engineering,University of Electronic Science and Technology of China Chengdu 611731;Big Data Research Center,University of Electronic Science and Technology of China Chengdu 611731)
机构地区:[1]电子科技大学计算机科学与工程学院,成都611731 [2]电子科技大学大数据研究中心,成都611731
出 处:《电子科技大学学报》2018年第4期633-640,共8页Journal of University of Electronic Science and Technology of China
基 金:国家自然科学基金(61433014;61673085);中央高校基本科研业务费专项资金(ZYGX2014Z002)
摘 要:根据社交媒体短文本特征改进了词袋模型,利用特征之间的语义关系提出了语义表示模型,采用句子中特征先后顺序构建了次序图模型,在此基础上引入时间因素,提出了基于Single-Pass算法的用户兴趣主题模型用于抽取微博用户关注的话题。实验结果表明,该方法的FM、AA和F指标相比FSC-LDA方法分别提高了200.40%、46.50%、80.05%。The bag of word model is first improved according to the social media short text feature. The semantic representation model is then proposed by using semantic relations between features. The sequence diagram model can be constructed by using the sequence of features in the sentence. On the base of these, together with time factor, we propose a user interest topic mode based on Single-Pass to extract the topic of user's attention. The experimental results show that the FM, AA and F of our method are increased by 200.40%, 46.50% and 80.05%, respectively, compared with the latest method FSC-LDA.
关 键 词:兴趣抽取 微博 Single-Pass 文本聚类 主题模型
分 类 号:TP181[自动化与计算机技术—控制理论与控制工程]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:216.73.216.15