基于P-Rank的网络书店相似性搜索  

Online bookstore similarity search based on P-Rank

在线阅读下载全文

作  者:吕巍[1] 邬春学[1,2] 张明西[3] 钟聃 

机构地区:[1]上海理工大学光电信息与计算机工程学院,上海200093 [2]上海理工大学新闻出版总署重点实验室,上海200093 [3]上海理工大学出版印刷与艺术设计学院,上海200093 [4]中国民用航空西北地区空中交通管理局计保中心通信室,陕西西安710075

出  处:《计算机工程与设计》2015年第10期2849-2855,共7页Computer Engineering and Design

基  金:国家自然科学基金项目(61202376);上海出版传媒研究院;上海出版印刷高等专科学校招标课题基金项目(SAYB1410);上海高校青年教师培养资助计划基金项目(ZZSLG14021);上海市教育基金会晨光计划基金项目(10CG49);上海市教委科研创新基金项目(13YZ075)

摘  要:为提高网络书店相似性搜索效率,降低时间和存储开销以适应大规模数据,提出一种基于P-Rank的相似性搜索优化算法ProductP-Rank。对相似性搜索算法进行分析和比较,指出相似性计算精确度和复杂度是现有算法所面临的难点;依据消费者与图书之间的购买关系构建购物网络,离线计算一步相似性矩阵,在线计算两步相似性矩阵。实验结果表明,该方法降低了相似性计算的存储和预计算时间的开销,具有较高精确度,能够快速响应查询请求。To increase the efficiency of algorithms on online bookstore's similarity search,and reduce time and space cost to adapt to large information network,ProductP-Rank,an optimized similarity search method,was proposed based on the basic idea of P-Rank.The past algorithms for similarity search were analyzed and discussed and the accuracy and complexity problems in similarity search were pointed out.By building the customer-product network according to the co-purchasing relationship,for a given query,the 2-hop similarity matrix between query and each item was computed based on the pre-computed 1-hop similarity matrix.Experimental results show the space cost and pre-computation time cost of ProductP-Rank were evidently less than that of P-Rank with little effectiveness loss and low online-query time cost.

关 键 词:相似性搜索 P-RANK 网络书店 “消费者-商品”关系网络 信息检索 

分 类 号:TP391[自动化与计算机技术—计算机应用技术]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象