垃圾网页

作品数:25被引量:37H指数:4
导出分析报告
相关领域:自动化与计算机技术更多>>
相关作者:张化祥贾志洋高爽孟莹于瑞国更多>>
相关机构:山东师范大学西南交通大学山东省分布式计算机软件新技术重点实验室天津大学更多>>
相关期刊:《信息技术与信息化》《计算机工程与设计》《信息安全与通信保密》《计算机与数字工程》更多>>
相关基金:国家自然科学基金山东省自然科学基金国家教育部博士点基金云南省教育厅科学研究基金更多>>
-

检索结果分析

结果分析中...
条 记 录,以下是1-10
视图:
排序:
基于二元分类的伪装型垃圾网页高效检测方法
《兰州工业学院学报》2019年第4期76-80,共5页魏欢 
安徽省质量工程项目(2015M00C144)
为了提高伪装型垃圾网页检测能力,提出一种基于二元分类的伪装型垃圾网页检测算法.对采集的各类网站网页样本进行暗链域名特征分析和网页爬虫分析,构建伪装型垃圾网页分布的相关文本和图片信息特征,对伪装型垃圾网页样本集采用垂直爬虫...
关键词:二元分类 垃圾网页 暗链接 检测 
基于关联属性主成分分析的SVM技术应用于Web Spam分类
《信息技术与信息化》2016年第4期65-69,共5页韩缤 计华 
基于特征建模优化及判别学习的web spam识别技术研究;国家自然科学基金(61170145);基于特征建模与优化的web垃圾页面识别技术研究;教育部博士点基金(20113704110001);Spam页面特征优化模型及非线性识别技术;山东省自然科学基金(ZR2010FM021)
垃圾网页(Web Spam)的大量存在严重降低了搜索引擎的检索效率。针对垃圾网页内容特征、链接特征的高维性及特征属性间的冗余性,本研究先对垃圾网页数据集中具有较高相关度的关联属性进行分组主成分分析(PCA),并选取最高贡献率的第一主...
关键词:垃圾网页 关联属性 主成分分析 支持向量机 
搜索引擎应对垃圾网页的技术研究
《电脑知识与技术(过刊)》2015年第9X期20-22,共3页李驰 李林 
介绍了常见的垃圾网页作弊方式。并对垃圾网页的识别方式进行了详细分析,包括基于网页内容的垃圾网页识别技术、基于链接结构来识别垃圾网页的Trust Rank算法以及目前比较流行的用于垃圾页面识别的机器学习分类法。其中采用Trust Rank...
关键词:搜索引擎 垃圾网页 网页作弊方式 垃圾网页识别 
基于改进的LogitBoost算法的垃圾网页检测研究
《科技视界》2015年第27期29-30,共2页周爽 王洪钰 李晓 孙磊 庞建萍 
2014年度国家级大学生创新训练项目(201401223)
实现垃圾网页的有效检测可以有效提高搜索引擎检索质量,促使网页的设计向着面向用户的方向发展。由于垃圾网页是面向搜索引擎设计的,正常网页是面向用户设计的,因而两者在特征方面存在众多区别,通过机器学习方法可以根据垃圾网页与正常...
关键词:垃圾网页识别 集成学习 WEKA logitboost 
基于免疫克隆选择算法的垃圾网页检测被引量:1
《计算机应用与软件》2015年第6期20-23,29,共5页杨凡 朱焱 唐寿洪 
四川省学术带头人培养基金项目(x8000912371309)
垃圾网页是指一些网页通过不正当的手段来误导搜索引擎,使网页获得高于其应有的排名,从而获得更多的访问量。它不仅降低了网页的质量,同时也导致了严重的Web信息安全问题。传统的垃圾网页检测通常使用经典的机器学习方法包括贝叶斯算法...
关键词:搜索引擎 垃圾网页 克隆选择 分类 
集成PCA降维与分类算法的垃圾网页检测被引量:4
《计算机应用与软件》2014年第10期269-272,共4页李法良 朱焱 曾俊东 
中央高校基本科研业务费专项基金项目(SWJTU11ZT08)
针对垃圾网页的内容特征和链接特征,设计一种集成主成分分析PCA(Principal Component Analysis)与支持向量机分类算法的垃圾网页检测方法。该方法使用PCA来提取网页样本特征的主成分,使用主成分特征训练支持向量机(SVM)分类器。训练过...
关键词:垃圾网页 垃圾网页检测 主成分分析 ADABOOST 支持向量机 
基于拟合特征分布的垃圾网页检测方法
《计算机工程与设计》2013年第8期2651-2655,共5页刘阳 张化祥 
国家自然科学基金项目(61170145);教育部高等学校博士点专项基金项目(20113704110001);山东省自然科学基金和科技攻关计划基金项目(ZR2010FM021;2008B0026;2010G0020115)
为了有效地检测垃圾网页,通过分析网页内容特征和链接特征的分布,发现正常网页特征分布有规律而垃圾网页特征分布散乱,根据正常网页特征分布与垃圾网页特征分布的不同,提出了用分布函数拟合正常网页特征分布,并计算正常网页和垃圾网页...
关键词:垃圾网页 内容特征 链接特征 分布函数 决策树 
基于海量冗余网页过滤的Web挖掘技术研究被引量:2
《科技通报》2013年第4期21-22,25,共3页赵玺 
智能教学系统通过搜索网页关键词获取教学资源时,由于存在许多具有相同关键词的垃圾网页的影响,使得教学资源较难从海量网页信息中快速挖掘出来,传统的关键词查找方法受垃圾网页的影响使得搜索量过大,造成智能教学资源获取的及时性不高...
关键词:智能教学 垃圾网页 信息抽取 
基于结合内容特征的TrustRank算法改进被引量:3
《计算机工程与设计》2013年第4期1276-1279,1330,共5页刘阳 张化祥 
国家自然科学基金项目(61170145);教育部高等学校博士点专项基金项目(20113704110001);山东省自然科学基金和科技攻关计划基金项目(ZR2010FM021;2008B0026;2010G0020115)
垃圾网页在利益的驱使下采用作弊手段欺骗搜索引擎获得更高的排名,干扰了用户对信息的获取。通过分析网页内容特征及其分布,提出了结合内容特征信息与TrustRank算法的方法对垃圾网页进行检测。实验结果表明,结合了内容特征信息的TrustR...
关键词:垃圾网页 搜索引擎 网页排名 信任指数 内容特征 
基于SMOTE和随机森林的Web spam检测被引量:11
《山东大学学报(工学版)》2013年第1期22-27,33,共7页房晓南 张化祥 高爽 
国家自然科学基金资助项目(61170145);教育部高等学校博士点专项基金资助项目(20113704110001);山东省自然科学基金资助项目(ZR2010FM021)
Web spam是指采用某些技术手段,使得网页在搜索引擎检索结果中的排名高于其应得排名的行为,它严重影响搜索结果的质量。考虑到Web spam数据集的严重不平衡情况,本研究提出先使用SMOTE过抽样方法平衡数据集,再利用随机森林算法训练分类...
关键词:集成学习 搜索引擎垃圾网页 随机森林 SMOTE 搜索引擎作弊 
检索报告 对象比较 聚类工具 使用帮助 返回顶部