基于散列关键词的大规模网页去重算法  被引量:1

在线阅读下载全文

作  者:王滨华[1] 石志刚[1] 

机构地区:[1]江南计算技术研究所,无锡214083

出  处:《高性能计算技术》2004年第5期35-38,共4页

摘  要:本文在已有的网页去重算法的基础上提出了基于网页特征和散列数据结构的大规模网页去重算法,并与其他的去重算法进行了比较。

关 键 词:散列 拉链法 特征码 最长公共子序列 

分 类 号:TP391[自动化与计算机技术—计算机应用技术]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象