基于聚类算法的恶意网站智能检测系统  

在线阅读下载全文

作  者:王帅 赵刚 岳媛 苗睿捷 刘海曼 

机构地区:[1]北京信息科技大学信息管理学院

出  处:《信息系统工程》2018年第4期71-73,共3页

基  金:国家自然科学基金项目--面向国家治理的云计算环境下联网审计流数据处理关键技术研究(61572079);北京信息科技大学2017促进高校内涵发展项目--学科项目和研究生科技创新项目;学科建设及研究生教育质量工程项目(5121723604)

摘  要:随着网络科技的日益发展,人们在享受互联网成果的同时,也遭受其负面产物如变化多样的恶意网站所带来的困扰。网址作为一般网站的唯一入口,检测并阻止其威胁行为已成为避免信息安全风险的重要控制措施。同时对未知网站的检测成为一种研究趋势。该系统主要功能是对恶意网站内容的智能检测,识别未知的网页是否异常。主要技术特点如下:1)采用了基于机器学习中的ART-2聚类算法,具有无监督地自学习特点,做到了实时更新检测。2)系统在学习新的网站时,不会破坏已存储的知识节点,实现对知识库的快速扩充。3)在数据预处理过程中加入了MMSEG分词算法,实现对中文文本的快速分词,提高了获取网页特征的准确性。后台通过网页内容获取、对html的标签内容做提取、MMSEG分词、特征降维并赋权重、ART-2聚类计算等五大功能,实现用户的请求。

关 键 词:ART-2聚类算法 恶意网站 机器学习 系统 

分 类 号:TP311.13[自动化与计算机技术—计算机软件与理论] TP393.092[自动化与计算机技术—计算机科学与技术]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象