检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
机构地区:[1]中国科学院计算机网络信息中心,北京100190 [2]中国互联网络信息中心,北京100190
出 处:《计算机应用研究》2015年第9期2779-2783,共5页Application Research of Computers
基 金:国家自然科学基金资助项目(61375039;61005029);中国科学院计算机网络信息中心"一三五"规划重点培育方向专项基金资助项目(CNIC_PY_1402)
摘 要:互联网搜索引擎排名算法中,外部链接是一个重要因素,而利用链接作弊现象普遍存在于互联网中。暗链是链接作弊其中的一种手段,难以检测和清除,被称为"网络牛皮癣"。为了维护公平的搜索引擎排名机制,保证搜索结果质量,针对暗链这种作弊手段,提出了一种基于机器学习的互联网暗链检测方法,该方法结合网页源码锚文本的特征检测暗链。给出了相关性能分析,在真实的网络环境下的实验验证表明了所提出的方法可行有效。该研究为搜索引擎打击链接隐藏的作弊行为提供了理论和实践支撑。External link is a critical factor in search engine algorithm, thus link spare is wide spread in Internet. Hidden hy- perlink is one kind of the link spam. It is the "psoriasis" in Internet, and hard to eradicate. In order to strike this cheating behavior and ensure quality of search results, this paper proposd a method to identify Web pages which contain hidden hyper- links based on machine learning, utilizing features of anchor text in HTML code of Web pages. It analyzed the performance of this model, and experiment based on the real Internet environment proves the method propose is effective. This study will pro- vide Search Engines with theoretical and practical support for striking the Web spam cheating.
分 类 号:TP393.08[自动化与计算机技术—计算机应用技术]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:216.73.216.145