基于特征码的网页去重  被引量:11

Duplicated Webpages Deletion Based on Feature Code

在线阅读下载全文

作  者:陈基漓[1] 牛秦洲[1] 

机构地区:[1]桂林工学院电子与计算机系,广西桂林541004

出  处:《微计算机信息》2006年第03X期113-115,共3页Control & Automation

基  金:广西区科技攻关项目(桂科攻0428002-1)

摘  要:网页去重处理是提高检索质量的有效途径,本文给出了一个基于特征码的网页去重算法,介绍了算法的具体实现步骤,采用二叉排序树实现。算法有较高的判断正确率,在信息检索中有较好的应用前景。Duplicated webpages deletion can improve quality of information retrieval. A duplicated webpages deletion algorithm based on feature code is given , the main steps of algorithm are introduced, the algorithm is realized on binary sort tree. The algorithm's precision is high, has better application in information retrieval.

关 键 词:网页去重 网页特征码 二叉排序树 

分 类 号:TP285[自动化与计算机技术—检测技术与自动化装置]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象