一种反Web Spam页面的方法  

A Method for Combating Web Spam Pages

在线阅读下载全文

作  者:蒋涛[1] 张彬[1] 

机构地区:[1]衡阳师范学院计算机科学系,衡阳421008

出  处:《计算机与数字工程》2007年第11期76-78,152,共4页Computer & Digital Engineering

摘  要:最近,spam页面急剧增加,这极大的影响了搜索引擎的精度和效率。如何抵御spam页面已经成为一个非常重要的问题。合并基于内容来侦测spam页面和基于链接spam侦测spam页面的方法,提出一个两步侦测spam页面的方法。第一步是一个过滤的步骤,用于生成spam页面的候选列表;第二步,通过一个自动的分类器从候选页面中侦测出最终的spam页面。Recently, the amount of web spam has increased dramatically and this influences the precision and efficiency of search engine greatly. How to combat web spam has become an important problem. This paper proposes an automated two-step method to detect web spam combined the methods based on content analysis and the methods based on link spam. The first step is a filtering step, which generates a candidate list of web spam. In the second step, a classifier is used to detect web spam from the candidates generated by the filtering step.

关 键 词:垃圾网页 TrustRank 链接spam 

分 类 号:TP393[自动化与计算机技术—计算机应用技术]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象