互联网上FTP文件的分布特征及启示  被引量:11

FTP Files' Distribution Characteristics and Their Implications

在线阅读下载全文

作  者:陈华[1] 王继民[1] 韩近强[1] 谢欣[1] 

机构地区:[1]北京大学计算机系网络实验室,北京100871

出  处:《计算机工程与应用》2004年第1期129-133,178,共6页Computer Engineering and Applications

基  金:国家973重点基础研究发展规划:网络环境下海量信息的理论与方法研究(编号:G1999032706)

摘  要:北京大学网络实验室的“天网”文件搜索引擎是国内自主开发的一个海量(FTP和HTTP)文件搜索引擎系统,它的数据库维护着1千多万的FTP文件与目录信息,索引了国内大部分匿名FTP站点。该文对“天网”的海量FTP文件目录信息的分布特征进行了研究,并分析了其对文件搜索引擎设计以及FTP服务器分类管理等方面的某些重要启示。该文的研究成果将增强人们对互联网上文件分布特征的了解,对于设计和优化一个大规模的文件搜索引擎系统具有积极的指导作用。Tianwang File Search is a massive high-quality Chinese and English search engine which has crawled and i ndexed millions ftp files.In this paper,we study the distribution characteris tics of ftp files and analyze some important implications to file search engin es.The research results in this paper are very helpful to the design and evalu ation of a massive FTP search engine,and they are useful for manage or classif y ftp sites too.

关 键 词:FTP文件与服务器 分布特征 搜索引擎 文件系统 数据挖掘 

分 类 号:TP393[自动化与计算机技术—计算机应用技术]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象