检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
作 者:韩忠明[1,2] 原碧鸿 陈炎 赵宁[1,2] 段大高
机构地区:[1]北京工商大学计算机与信息工程学院,北京100048 [2]食品安全大数据技术北京市重点实验室,北京100048
出 处:《计算机应用研究》2018年第2期410-416,共7页Application Research of Computers
基 金:国家自然科学基金资助项目(61170112);北京市自然科学基金资助项目(4172016);国家教育部人文社会科学研究基金资助项目(13YJC860006)
摘 要:电影票房预测是一个具有挑战性的问题,尤其是早期预测电影票房。基于社会媒体等预测方法存在准确度低、难以早期预测等问题,提出了一种基于GBRT模型的早期电影票房预测模型。对影响电影票房的因素进行特征化处理,选择包括演员、导演、上映日期以及公司等在内的九种因素,分别采用社会网络节点影响力度量法、平均票房权重区间化等不同的特征化方法;然后,生成34个特征作为影响电影票房的因变量,对特征与电影票房建立GBRT模型。选择2000—2015年间的1 875部电影以及相应的8 203名影人和3 300家公司进行了大量实验,实验结果表明该模型具有良好的预测效果,相对准确率达到80.6%,对部分2016年新电影进行预测,其误差在10%以内。It's a challenging subject to predict box-office of movies especially at the early stage. Concerning the limitations that accuracy of prediction is low and prediction of movie is difficult at the early stage, this paper proposed a model to predict box-office of movie based on the gradient boosting regression tree(GBRT). The model characterized the influencing factors of box-office such as actors, directors, release dates, the companies and so on by using different methods, which included influence measuring of social network nodes, ranging the average weight, etc. Next, it created a GBRT model with dependent variables in- cluding thirty-four features. Experimental dataset was collected 1 875 movies,8 203 players and 3 300 companies ranging from 2000 to 2015. The experimental results demonstrate the model can predict box-offices effectively, relative accuracy is up to 80. 6% ,and the error that predicting box-office of new movies in 2016 is less than 10%.
关 键 词:梯度回归树(GBRT) 电影早期因素 电影票房预测 影响力度量
分 类 号:TP301.6[自动化与计算机技术—计算机系统结构]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:216.73.216.222