轻量级的自学习网页分类方法  被引量:2

Light-weight self-learning approach for URL classification

在线阅读下载全文

作  者:沙泓州 周舟[2,3] 刘庆云[2,3] 秦鹏[2,3] 

机构地区:[1]北京邮电大学计算机学院,北京100876 [2]中国科学院信息工程研究所,北京100093 [3]信息内容安全技术国家工程实验室,北京100093

出  处:《通信学报》2014年第9期32-39,共8页Journal on Communications

基  金:国家高技术研究发展计划("863"计划)基金资助项目(2011AA010703);国家自然科学基金资助项目(61070026)~~

摘  要:提出了一种自学习的轻量级网页分类方法 SLW。SLW首次引入了访问关系的概念,使其具有反馈和自学习的特点。SLW从已有的恶意网页集合出发,自动发现可信度低的用户和对应的访问关系,从而进一步利用低可信度用户对其他网页的访问关系来发现未知的恶意网址集合。实验结果表明,在相同数据集上,相比于传统检测方法,SLW方法可以显著提高恶意网页检测效果,大幅降低平均检测时间。A self-learning light-wight (SLW) is proposed.SLW is the first to introduce access relations and have the characteristics of feedback and self-learning.SLW approach starts from the seed set which includes known malicious pages.Then,it automatically figures out users with low credibility based on the seed set and the visit relation database.Finally,the access records of these users are used to identify other malicious pages.Experimental results indicate that SLW approach can significantly improve the efficiency of malicious pages detection and reduce the average detection time compared with other conventional methods.

关 键 词:URL分类 黑名单 访问关系 恶意网页 网页评价 

分 类 号:TP393.8[自动化与计算机技术—计算机应用技术]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象