检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
作 者:杨兴华[1] 封化民[1,2] 江超[1] 陈春萍[1]
机构地区:[1]西安电子科技大学通信工程学院,陕西西安710071 [2]北京电子科技学院,北京100070
出 处:《北京电子科技学院学报》2011年第2期46-57,共12页Journal of Beijing Electronic Science And Technology Institute
基 金:国家自然科学基金项目"基于多模态特征的多媒体语义分析关键理论与技术研究(No.60972139)";北京市自然科学基金项目"基于网络多媒体信息语义的网络舆情分析研究"(No.4092041)"的资助
摘 要:近年来,垃圾邮件制造者为了逃避基于文本的垃圾邮件过滤系统的检测,将垃圾信息嵌入到图像中,并将其附着在邮件正文中进行传播。传统的基于文本的过滤方式无法处理此类包含垃圾信息的邮件图像。为了应对这种同时包含文本和图像的垃圾邮件,本文提出了一种基于多模态特征的融合文本、图像等多媒体信息的过滤方法。首先通过抽取邮件的文本特征和图像特征构建多个分类器,然后采用多分类器融合技术对各分类器的输出结果进行综合。通过对TREC垃圾邮件语料集的测试实验表明,本文提出多模态特征融合的方法获得了比单个分类器更好的效果,准确率达到90%以上。In recent years,for escaping the text-based spam filtering detection system,the spammers insert junk information into the image and attach it to the message body.In order to deal with such spam that contains text and images,a new filtering method is proposed,which fuses text,image and other multi-modal features by extracting the text features and image features to build multiple classifiers,and by employing multiple classifier fusion technology to integrate the output of each classifier.The experimental result on TREC dataset show that the fusion method achieves a better result than that of a single classifier and can achieve over 90% in accuracy rate.
分 类 号:TP393[自动化与计算机技术—计算机应用技术]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:216.73.216.15