检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
出 处:《北京邮电大学学报》2014年第3期38-42,共5页Journal of Beijing University of Posts and Telecommunications
基 金:国家自然科学基金项目(61273365);国家高技术研究发展计划项目(2012AA011104)
摘 要:社会化标签中普遍存在标签的主题粒度和文档不一致以及部分标签和文档内容无关这两个问题,而现有基于主题模型的社会化标签推荐算法并没有同时对二者进行建模.针对这两点,提出了一种新的主题模型,该模型不仅允许标签和文档具有各自的主题粒度,而且允许标签来自与文档无关的噪声主题.在两个不同的社会化标签语料上的实验结果表明,所提出的模型相比内容相关模型和标签的隐含狄利克雷分配模型,在混淆度和平均正确率均值这两个指标上均有所提高.It is common that the topic-granularity of social tags is not consistent with correspondent document, and some tags cannot describe the topic of the document content. The existing topic models-based tag recommendation did not address the foregoing problems simultaneously as well. Motivated by the fact, the proposed novel topic model allows different granularity of word topics and tag topics, and assumes that the tags can originate from a general distribution unrelated to the content. Experimental results show that the proposed model outperforms content relevance model (CRM) and tag-logical device address (tag- LDA) on two different social tagging corpora in both perplexity and mean average precision.
关 键 词:社会化标签推荐 主题模型 标签主题粒度 噪声标签
分 类 号:TN929.53[电子电信—通信与信息系统]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:216.73.216.249