海量Web搜索引擎系统中用户行为的分布特征及其启示  被引量:45

在线阅读下载全文

作  者:王建勇[1] 单松巍[1] 雷鸣[1] 谢正茂[1] 李晓明[1] 

机构地区:[1]北京大学计算机科学技术系网络与分布式系统研究室,北京100871

出  处:《中国科学(E辑)》2001年第4期372-384,共13页Science in China(Series E)

基  金:国家"九七三"重大基础研究发展规划项目 (批准号 :G19990 32 70 6 )

摘  要:统计分析了大规模搜索引擎系统的用户行为的分布特征 .结果表明 ,用户查询内容和URL点击表现出明显的局部性 ;用户查询的分布符合幂函数的特征并具有良好的自相似性 .基于上述规律 ,设计了查询cache ,比较了FIFO ,LRU及带衰减的LFU等 3种cache替换策略 .然后 ,基于用户行为考察了海量网页信息的分布特征 ,并利用URL的入度、镜像度、目录深度等网页参数与用户行为反馈后的相关度的方差分析 ,阐明了其对优化搜索引擎系统定序算法 (rankingalgorithm)的启示 .

关 键 词:万维网 搜索引擎系统 分布特征 WEB网页 用户行为 Internet 用户查询 

分 类 号:TP393.09[自动化与计算机技术—计算机应用技术]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象