检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
作 者:朱琛刚[1,2] 程光[1,2] 胡一非 王玉祥[1,2]
机构地区:[1]东南大学计算机科学与工程学院,南京211189 [2]教育部计算机网络和信息集成重点实验室(东南大学),南京211189
出 处:《计算机研究与发展》2016年第4期742-751,共10页Journal of Computer Research and Development
基 金:国家"八六三"高技术研究发展计划基金项目(2015AA015603);江苏省未来网络创新研究院未来网络前瞻性研究项目(BY2013095-5-03);江苏省"六大人才高峰"高层次人才项目(2011-DZ024)~~
摘 要:针对互联网+电视平台为提高热点节目命中率而过渡消耗存储空间的问题,提出一种基于流行度预测的节目缓存调度算法PPRA(popularity prediction replication algorithm).首先,在对实际测量数据进行统计与分析的基础上,使用随机森林(random forests,RF)算法构建节目流行度预测模型.同时,针对所选特征存在的"维数灾难"问题,利用主成分分析法(principal component analysis,PCA)实施特征降维处理,以实现视频流行度预测值的快速计算.然后基于节目流行度预测数据调度缓存中的节目.最后以某广电运营商130万用户120d的收视数据为例,对PPRA算法进行实验.实验结果表明,在保证一定缓存命中率前提下,与LRU,LFU算法相比,PPRA算法仅需30%的存储空间,可有效降低互联网+电视平台的建设成本.Internet plus TV tends to excessively consume storage space to achieve higher cache hit ratio.A novel cache schedule algorithm called PPRA(popularity prediction replication algorithm)is proposed in this paper based on programs popularity forecast.Firstly,according to statistical analysis from actual measurement,we apply random forests(RF)algorithm to construct a forecasting model of programs popularity.Subsequently,we use the principal component analysis(PCA)to overcome dimensionality curse and accelerate the forecasting process.Finally,we validate PPRA with authentic behavior data of a certain cable operator's 1.3million users in a period of 120 days.Our experimental results show that PPRA only consumes 30%storage space to achieve a fixed cache hit ratio compared with LRU and LFU algorithms,therefore the cost of Internet plus TV platform is saved.
关 键 词:互联网+电视 流行度预测 随机森林 缓存策略 维数灾难
分 类 号:TP393[自动化与计算机技术—计算机应用技术]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:216.73.216.145