基于DPI的用户兴趣实时分类  被引量:4

A real time approach to user interest classification using DPI

在线阅读下载全文

作  者:陈康[1] 付华峥 陈翀[1] 张宇艺 韦誉 

机构地区:[1]中国电信股份有限公司广州研究院,广东广州510630 [2]广东工业大学计算机学院,广东广州510006 [3]广州优亿信息科技有限公司,广东广州510630

出  处:《电信科学》2016年第12期109-115,共7页Telecommunications Science

摘  要:近年来,随着大数据发展热潮兴起,电信运营商能获得的DPI数据规模越来越大。如何对如此海量的DPI数据进行实时的挖掘和分类是运营商研究的热点。设计了一种基于混合n-gram特征的URL分类算法和基于Doc2Vec模型的文本分类算法相结合的DPI数据分类方法,大大提高了DPI数据的分类速度和分类准确率,为电信运营商进行精准营销提供了良好的基础。In recent years, with the rapid development of internet, telecom operators can gather more and more DPI data. How to mine and classify huge amounts of DPI data in real time is the key point. A DPI data classification method was presented, which combined the URL classification model based on mixed n-gram features and the Doc2 Vec based text classification algorithm. The DPI data classification speed and classification accuracy were greatly improved, and good support for precise marketing was provided.

关 键 词:DPI URL分类 文本分类 N-GRAM Doc2Vec 

分 类 号:TP311[自动化与计算机技术—计算机软件与理论]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象