检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
机构地区:[1]中南大学信息科学与工程学院,湖南长沙410083 [2]湖南中医药大学计算机系,湖南长沙410208
出 处:《企业技术开发》2009年第5期16-17,31,共3页Technological Development of Enterprise
摘 要:文章介绍了WEBSPAM-UK2006数据集,一个大型的基于现实世界的,人工评判过一些垃圾行为的web数据集合,详细的对数据集的构成进行了分析,对数据集采用Python进行了初步的预处理,为以后在反垃圾网页行为方面的算法和判定研究提供了非常有意的经验和参考。This paper introduces WEBSPAM-UK2006 data sets, based on a large-scale real-world and artificial judged some acts of garbage collection web data. And detailed data sets to constitute an analysis of data sets using Python to carry out a preliminary pre-processing, have been some valuable experience and data, these experiences at a later anti-page behavior algorithms and determine the research provided a very deliberate reference.
分 类 号:TP393.07[自动化与计算机技术—计算机应用技术]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:3.144.252.248