检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
作 者:刘祥涛[1,2] 龚才春[3] 刘悦[1] 白硕[1]
机构地区:[1]中国科学院计算技术研究所,北京100190 [2]中国科学院研究生院,北京100190 [3]北京市计算中心,北京100005
出 处:《中文信息学报》2010年第6期85-91,共7页Journal of Chinese Information Processing
基 金:国家自然科学基金资助项目(60803085;60873245);国家863计划高技术研究发展计划资助项目(2006AA01Z452)
摘 要:Kad网络中存在数以亿计的共享资源,而其中有相当一部分可被评定为敏感资源。为深入了解Kad网络上资源尤其是敏感资源的特征,运用Kad网络采集器:Rainbow对节点拥有的文件资源进行探测分析。该文发现:1)文件流行度和文件所对应的文件名数量都近似符合Zipf分布;2)利用同一个"文件内容哈希"(即file-content-hash)的多个文件名的共现词可以更准确地进行敏感判别;3)敏感资源占随机样本的6.34%,且敏感资源中74.8%为video文件。In Kad network,there are hundreds of millions of shared resources,among which a considerable part can be rated as questionable information.In order to understand the characteristics of resources,especially questionable ones,in Kad network,the file resources of peers are measured and analyzed using the Kad-network crawler Rainbow.We find that: 1) both the popularity of files and the number of filenames corresponding to a file approximately fit Zipf distribution;2) the severity of questionable files can be judged more accurately using co-occurrence-words in multiple filenames corresponding to the same file-content-hash;3) the questionable resources only occupy 6.34% of random samples,and 74.8% of which are video files.
分 类 号:TP391[自动化与计算机技术—计算机应用技术]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:216.73.216.173