Web集群中文档组织分布的优化策略  被引量:1

Optimization Strategy for Organization and Distribution of Documents in Web Server Cluster

在线阅读下载全文

作  者:熊智[1] 晏蒲柳[1] 郭成城[1] 

机构地区:[1]武汉大学电子信息学院,武汉430079

出  处:《计算机科学》2006年第11期114-118,共5页Computer Science

基  金:国家自然科学基金(90204008);武汉市重大科技攻关项目(20001001004)的资助

摘  要:Web集群服务器已被广泛用来提高Web服务器的性能。对于如今内容海量级的大型网站来说,如何在Web集群服务器上组织和分布Web文档是一个急需解决的问题。本文提出了一种Web集群服务器中文档组织和分布的优化策略,其目是减少集群系统的平均响应时间。通过对Web服务器日志的分析,挖掘客户的访问模式,将关联度高的网页聚类成网页簇,然后根据网页簇的负载计算其拷贝份数,最后在集群中优化分布各网页簇的拷贝。以这种方法组织和分布文档,可以减少服务器端的TCP连接迁移开销,可以实现集群内的负载均衡,从而减小集群系统的平均响应时间;且相对于内容全镜像的文档分布方案,节约了存储空间,减少了维护各服务器文档一致性的开销。Web server cluster has been widely used to increase the performance of Web servers. For a large website, how to organize and distribute the Web documents is imperative. This paper proposes a strategy to organize and distribute Web documents in Web server cluster, whose aim is to reduce the average response time of cluster system. Through the analysis of Web servers~ logs, discover the client's access patterns, then group the webpages closely related into webpage clusters, then calculate every webpage cluster's copy number according to their load, finally distribute the copies of webpage clusters among servers. Such strategy can reduce the overhead of TCP connection migration, and achieve load balancing among servers, thereby reducing the average response time of cluster system. In addition, compared with the method of mirror image, our strategy saves storage space, and reduces the overhead of maintaining the coherence of the documents.

关 键 词:WEB集群服务器 网页簇 文档组织 文档分布 

分 类 号:TP393.4[自动化与计算机技术—计算机应用技术]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象