基于特征串的网页去重算法  被引量:3

在线阅读下载全文

作  者:姚新波[1] 马治坤 

机构地区:[1]宁夏大学数学与计算机学院,宁夏银川750021 [2]宁夏农垦集团,宁夏银川750002

出  处:《科技信息》2008年第28期411-,430,共2页Science & Technology Information

摘  要:用户在互联网中网页检索时,经常会得到大量内容相同的冗余页面,不仅浪费了存储资源,而且给用户带来许多不便。本文对现有的几种重复网页识别技术的优缺点进行了比较,并且重点讨论了基于特征串的网页快速去重算法。

关 键 词:重复网页识别 特征串 召回率 

分 类 号:TP393.092[自动化与计算机技术—计算机应用技术]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象