检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
机构地区:[1]西安电子科技大学计算机学院,陕西西安710071
出 处:《西安电子科技大学学报》2013年第6期116-124,共9页Journal of Xidian University
基 金:国家自然科学基金资助项目(61072109;61272280;41271447;61272195);教育部新世纪优秀人才支持计划资助项目(NCET-12-0919);中央高校基本科研业务费专项资金资助项目(K5051203020;K5051203001;K5051303018)
摘 要:提出了一种新的程序行为抽象方法,将程序执行时发起的API调用、网络数据包信息以及静态分析给出的文件结构特征作为数据源,对API序列进行低聚合度依赖关系分析,将网络数据包信息及静态分析结果转化为离散值特征,共同嵌入到高维特征空间中.在此基础上,采用决策树作为子分类器,针对AdaBoost.M1算法容易过度拟合噪声数据的问题,设计出一种基于改进AdaBoost.M1算法的恶意程序行为检测算法.该算法采用一种新的损失函数,降低了噪声数据进入训练下一个子分类器的训练样本集的概率,提高了算法的抗噪声能力;同时,为每个子分类器生成一个投票向量,而不是单一的投票权值,以区分子分类器对不同类别样本分类的能力.We present a new algorithm for abstracting features of a program from its API calls, network packages and static analysis characteristics. AP1 calls are aggregated by a low level data dependence analysis to form the abstract behaviors. Network packages and static analysis characteristics are directly utilized as discrete value features. All of these abstract features are then embedded in a high dimension vector space. Besides, we further design a new behavior-based malware classification algorithm, which advances the AdaBoost boosted decision tree algorithm. Firstly, the new algorithm optimizes an anti-noise loss function to lower the probability of the noise data to train the next classifier, and thus improves the anti-noise ability of the AdaBoost algorithm. Secondly, to improve the algorithm's performance in multi-class classif bication problem, a vote vector is adopted to combine base classifiers, which discriminates the accuracy with which a classifier classifies samples from different classes.
关 键 词:恶意程序 行为抽象 分类 决策树 ADABOOST 损失函数
分 类 号:TP391.4[自动化与计算机技术—计算机应用技术]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:3.137.222.1