基于PLSA的大众标注资源主题挖掘  被引量:5

Explore Network Resource Topics from Social Annotations System Based on PLSA

在线阅读下载全文

作  者:王嵩[1] 代逸生[1] 李保珍[1] 

机构地区:[1]江苏科技大学经济管理学院,镇江212003

出  处:《现代图书情报技术》2010年第3期47-51,共5页New Technology of Library and Information Service

基  金:教育部人文社会科学研究项目"Web2.0环境下基于大众标注的网络民意跟踪与鉴别模式"(项目编号:09YJC870010);江苏省教育厅高校哲学社科基金项目"基于大众标注的网络舆情监测"(项目编号:09SJB860002)的研究成果之一

摘  要:针对大众标注中用户生成标签的随意性以及无规则性所导致的标签混乱问题,引入潜在语义索引分析PLSA算法,得到特定资源主题下的标签集,为网络信息组织及用户获取提供有效的途径。通过抽取Delicious网站中的用户标注信息,证实PLSA方法对于特定资源的主题特征具有比较好的效果。Due to the random of mass tagging user - generated tags and non - regularity of confusion arising from the label, this paper introduces the Probabilistic Latent Semantic Analysis (PLSA) algorithm for latent semantic indexing analysis, gets the label set of specific resources under the theme and provides an effective approach for the network infor- mation organization and the user' s access. By taking the user annotation information through Delicious site, the paper substantiates that the PLSA approach can achieve a good result for the subjects of particular resources .

关 键 词:大众标注 概率潜在语义分析 语义标签 资源主题 

分 类 号:TP391.3[自动化与计算机技术—计算机应用技术]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象