检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
作 者:余慧佳[1] 刘奕群[1] 张敏[1] 马少平[1] 茹立云[1]
机构地区:[1]智能技术与系统国家重点实验室,清华信息科学与技术国家实验室(筹),清华大学计算机系,北京100084
出 处:《中文信息学报》2009年第2期95-101,共7页Journal of Chinese Information Processing
基 金:国家973重点基础研究资助项目(2004CB318108);国家自然科学基金资助项目(60621062,60503064,60736044);国家863高科技资助项目(2006AA01Z141)
摘 要:随着互联网的飞速发展,因网络作弊而产生的垃圾页面越来越多,严重影响了搜索引擎的检索效率和用户体验。反作弊已经成为搜索引擎所面临的最重要挑战之一。但目前的反作弊研究大都是基于页面内容或链接特征的,没有一个通用可行的识别方法。本文主要基于作弊目的的分析,给出作弊页面另一种体系的分类,为基于目的的作弊页面识别起到良好的导向作用。Along with the rapid development of the Internet, the spam pages which produced by web spam are prevailing and seriously impacts the retrieval efficiency of the search engine and the user experience. Anti-spam has become one of the most important challenges for the search engines. State-of-the-art anti-spare techniques usually make use of Web page features, either content-based or hyper-link structure based, to construct Web spare classifiers, which can't deal with different spam techniques simultaneously. This paper proposes another kind of web spare taxonomy via spare intention analysis, so as to give some useful information for intent-based detection of spam pages.
关 键 词:计算机应用 中文信息处理 网络作弊 目的分析 作弊页面分类
分 类 号:TP391[自动化与计算机技术—计算机应用技术]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:216.73.216.79