检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
作 者:曾金[1,2] 陆伟 陈海华[1,2] 贺国秀[1,2]
机构地区:[1]武汉大学信息管理学院,湖北武汉430072 [2]武汉大学信息检索与知识挖掘研究所,湖北武汉430072
出 处:《情报科学》2018年第1期124-129,共6页Information Science
基 金:国家自然科学基金面上项目(71473183)
摘 要:【目的/意义】通过社交媒体用户分享的图像、博文及用户标签进行数据挖掘,来判断和预测用户的真实兴趣,从而更好地为用户做个性化推荐和精准化服务。【方法/过程】在获取微博用户分享的图像、博文及用户标签的基础上,通过使用机器学习的方法利用图像、博文及用户标签数据来表达用户兴趣特征,基于三类特征使用SVM训练得到分类器进行用户兴趣类别预测,主要比较单模数据和多模数据的分类指标,探讨多模数据在有监督学习下的发多分类问题。【结果/结论】实验结果表明,利用图像、博文和用户标签合成的多模数据对用户兴趣进行分类识别,F值达到77%,比最好的单模数据提升10%。实验结论证实,多模(图像、博文和标签)数据与单模数据相比,提升了分类效果,同时为多模数据应用研究提供了一定的理论和技术基础。[Purpose/significance] By analyzing and fusing micro-blog image, post information and user tag, mining and predicting users' real interests, in order to do a better and more precision personalized recommendation services. [Method/ process ] Firstly, a micro-blog user oriented spider is implemented to crawl image, text and tag data. After that, three user interest feature sets were constructed by using CNN,Word2vec and BOW, based on which we used SVM to train classifier and predict users' interest on these data respectively, we aimed at comparing the classification indicators between single mode data and multi-mode data, and exploring multi-classification problem on multi-mode data under supervised learning method. [ Result/conclusion] Our experiment results show that user interest identification integrating images, texts and tags achieved 77% on F1 score, which achieved 10% improve on F1 score compared to the ever best single mode data. The pro- posed method can effectively predict user interest, which provides a theoretical and technical basis for the application of multi-mode data.
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:216.73.216.236