检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
机构地区:[1]北京大学计算机系网络实验室,北京100871
出 处:《计算机工程与应用》2004年第1期129-133,178,共6页Computer Engineering and Applications
基 金:国家973重点基础研究发展规划:网络环境下海量信息的理论与方法研究(编号:G1999032706)
摘 要:北京大学网络实验室的“天网”文件搜索引擎是国内自主开发的一个海量(FTP和HTTP)文件搜索引擎系统,它的数据库维护着1千多万的FTP文件与目录信息,索引了国内大部分匿名FTP站点。该文对“天网”的海量FTP文件目录信息的分布特征进行了研究,并分析了其对文件搜索引擎设计以及FTP服务器分类管理等方面的某些重要启示。该文的研究成果将增强人们对互联网上文件分布特征的了解,对于设计和优化一个大规模的文件搜索引擎系统具有积极的指导作用。Tianwang File Search is a massive high-quality Chinese and English search engine which has crawled and i ndexed millions ftp files.In this paper,we study the distribution characteris tics of ftp files and analyze some important implications to file search engin es.The research results in this paper are very helpful to the design and evalu ation of a massive FTP search engine,and they are useful for manage or classif y ftp sites too.
关 键 词:FTP文件与服务器 分布特征 搜索引擎 文件系统 数据挖掘
分 类 号:TP393[自动化与计算机技术—计算机应用技术]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:216.73.216.3