一个基于现实世界的大型Web参照数据集——UK2006 Datasets的初步研究  

A based on real-world data sets with reference to large-scale Web——UK2006 Datasets preliminary study

在线阅读下载全文

作  者:曾刚[1,2] 李宏[1] 

机构地区:[1]中南大学信息科学与工程学院,湖南长沙410083 [2]湖南中医药大学计算机系,湖南长沙410208

出  处:《企业技术开发》2009年第5期16-17,31,共3页Technological Development of Enterprise

摘  要:文章介绍了WEBSPAM-UK2006数据集,一个大型的基于现实世界的,人工评判过一些垃圾行为的web数据集合,详细的对数据集的构成进行了分析,对数据集采用Python进行了初步的预处理,为以后在反垃圾网页行为方面的算法和判定研究提供了非常有意的经验和参考。This paper introduces WEBSPAM-UK2006 data sets, based on a large-scale real-world and artificial judged some acts of garbage collection web data. And detailed data sets to constitute an analysis of data sets using Python to carry out a preliminary pre-processing, have been some valuable experience and data, these experiences at a later anti-page behavior algorithms and determine the research provided a very deliberate reference.

关 键 词:搜索引擎作弊 Web数据集 链接分析 Web图 

分 类 号:TP393.07[自动化与计算机技术—计算机应用技术]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象