基于Hadoop平台的内容相似度与PageRank的垃圾短信识别融合模型  

在线阅读下载全文

作  者:叶志雄[1] 朱丽芳[1] 刘钢庭[1] 李启文[1] 王丹弘 

机构地区:[1]中国移动通信集团广东有限公司

出  处:《广东通信技术》2016年第9期5-9,共5页Guangdong Communication Technology

摘  要:垃圾短信是一种包含有欺诈、骚扰等内容的异常短信,不仅损害通信行业的形象,浪费通信卡资源,还会产生商业诈骗,引发客户不满。垃圾短信以商业、广告类和欺骗类信息为主要内容,其特征明显区别于正常短信;同时,客户之间的短信发送行为是一种真实的社交关系。基于此,论文对垃圾短信的识别采用基于Hadoop大数据平台的模型融合方法,在常规的内容相似度模型基础上,对短信发送行为构建PageRank社交技术模型,通过对上述模型加权融合,最后得出批量的高疑似垃圾短信,实验结果表明融合模型效果较优。

关 键 词:垃圾短信 HADOOP 内容相似度 PAGERANK 贝叶斯 

分 类 号:TP391.1[自动化与计算机技术—计算机应用技术]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象