检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
机构地区:[1]大连理工大学计算机科学与技术学院,辽宁大连116024
出 处:《计算机工程》2012年第15期50-52,共3页Computer Engineering
基 金:国家自然科学基金资助项目(60673039;60973068);国家"863"计划基金资助项目(2006AA01Z151);教育部留学回国人员科研启动基金资助项目;高等学校博士学科点专项科研基金资助项目(20090041110002)
摘 要:利用社会化标注对网页检索进行改进,提出一种加权的社会化SimRank算法。从社会化标注系统中提取网页以及标签词之间的相似度信息。分别用这2类相似度信息来计算网页本身的质量同网页与查询之间的相关性。依据网页的质量和相关性信息对网页进行重排序。在del.icio.us网站抽取真实标注数据集进行实验,结果表明,该方法挖掘到的信息能够较好地改善网页检索效果。This paper concerns with the issue of how to enhance Web retrieval with social annotations.It proposes a weighted social SimRank algorithm to get the similarity information of pages and annotations from social tagging system.The two types of similarity information are used to calculate quality of the pages and the relevance between pages and queries,respectively.And the pages are reordered according to the pages’quality and relevance information.Experiments are carried out on a real-world annotation data set which is sampled from del.icio.us.Experimental results show the significant improvements over traditional methods and the effectiveness of the proposed algorithm.
关 键 词:网页检索 社会化标注 SimRank算法 语言模型 相似度
分 类 号:TP311.5[自动化与计算机技术—计算机软件与理论]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:3.141.29.119