电影上映后的百度指数能推测出票房成绩吗?
注:如果你想快速提升百度指数,迅速刷百度指数上去,加微信号:jipiiiii 了解。
在上一期中,我们分析了映前百度指数峰值和映前百度指数平均值对票房和排片的影响,结果发现百度指数上映前一周的平均值参考意义要大于峰值,百度指数平均值确实是与票房和排片是强关联的,但是无奈模型的解释率太低,暂时还没找到有效的线性预测模型。
温故而知新看这里:
电影上映前的百度指数和首日排片和票房有关系吗?
0 1 、引言
当时做完这个分析后,我们就在思考,如果像第一期提到的那样,猫眼评分和豆瓣评分所代表的映后口碑与票房是有关联的,那么,电影上映后,受到口碑影响的百度搜索指数,是否也会对票房产生影响呢?
详细解释一下为什么会产生这个想法。首先,对于普通电影,百度指数会在上映前一天(-1)至上映后一天(+1)达到峰值,随后慢慢回落,例如《侏罗纪世界2》这种,
《侏罗纪世界2》的百度指数在上映后一天达到峰值
而许多我们说的“黑马电影”,都是由于映后口碑起来了,导致更多人搜索电影的相关讯息,所以百度指数的峰值在上映后几天才达到顶峰;映后搜索量会出现连绵小波峰,热度甚至比上映前还高。
用今年现象级黑马电影《超时空同居》和《我不是药神》来举个例子:
《超时空同居》5.18上映,5.20日搜索量达到峰值,热度是上映当天的三倍,而且上映后的搜索量平均值比上映前高出了许多,出现了几个搜索波峰。
《我不是药神》7.5上映,上映后三天(7.8)搜索量达到峰值,为上映当天的1.5倍,且映后出现小波峰。
经过观察一系列黑马电影,发现搜索热度普遍是在上映后2-4天内达到顶峰,于是我们产生了一个大胆的想法:
💡把百度指数上映后一周的平均值作为反映口碑的变量之一,分析它与票房的关系;
💡此外,在上一期,我们研究了百度指数峰值(不包括上映当天及上映后)对票房的影响,这次为了把搜索热度所反映的口碑纳入考量,我们决定加入“宣发期百度峰值”(包括上映当天及上映后)作为一个变量,这样能帮助我们更好的理解口碑对票房的影响到底有多大。
0 2 、方法
我们还是使用同一个数据库——17年4月至18年6月,首日排片率≥8%,共计147部电影作为样本。
这次的变量是:
①宣发期百度指数峰值:电影整个宣发周期内达到的百度峰值,包括映前及映后
②百度指数上映后一周平均值:电影上映后一周的百度指数相加再除以七天,用其代表上映后一周网民对于电影的搜索情况。
③总票房
研究问题 :电影的宣发期百度指数峰值和百度指数上映后一周平均值,与总票房有关系吗?
0 3 、 过程
先是进行数据清理:有些片子由于百度指数异常或缺失,比方《速度与激情》其中“激情”没有搜索结果,数据清理后留下124部电影。
我们重点对3个数据之间进行两组线性分析:
A. 宣发期百度指数峰值 x 票房
结果显示:相关性为0.814,挺强的正相关关系,之前的分析都没见过这么高的。显著性为0.000,证明有99.999%的可能性宣发期百度指数的峰值与票房是有关系的。
调整后R方为0.66,这也是我们最近几次分析,看到的最高的数值了,说明这个预测模型解释率有66%,也许可以通过模型来预测票房。
公式:总票房=-81.538+0.334*宣发期百度峰值(这可是66%解释率的公式呢)
怀着激动的心情,我拿了一部正常电影(非爆款、非黑马、中规中矩、口碑没崩、正常档期)来做实验,看看测的准不准——
就是你了!
《暴裂无声》,峰值13252
→ 预测票房4344.6万,实际票房5424.5万,相差1000万+,卒
我不信,再试一个《奇葩朵朵》,峰值15670
→ 预测5152万,实际3021.4万,相差2000万,卒
最后一个吧,《寂静之地》,峰值86162
→ 预测28696万,实际22100万,相差6500万……hmmm。下一题下一题。
B. 百度指数上映后一周平均值 x 票房
结果显示:相关性为0.837,很强的正相关关系,甚至比前一组还高。显著性为0.000,证明有99.999%的可能性百度指数上映后一周平均值与票房是有关系的。
调整后R方为0.698,也比前一组高,说明这个预测模型解释率有69.8%,接近70%了哦。也许可以通过模型来预测票房。
得出公式:总票房=-424.247+0.514*百度指数映后一周均值
模型解释率高达69.8%,显示后期口碑是影响票房的重要因素。
不死心的我再拿验证峰值的那几部电影来测试一下,看看这个模型是不是的确更好预测票房!
《暴裂无声》,百度指数映后一周平均值11252
预测票房5359.28,实际票房5424.5万。只相差了65万!!
《奇葩朵朵》,百度指数映后一周平均值6808
预测票房3075万,实际票房3021.4万,差距缩小到了53万!!兴奋到飞起!!
《寂静之地》,百度指数映后一周平均值122817
预测票房62703万,实际票房22100万,这个就差的比较远了。它的映后平均值过高了,显示出《寂静之地》的关注度很高,但很多人是观望态度的,真正走进电影院的人却很少,这种小众电影的情况就很有意思了。
综上,百度指数上映后一周平均值,真的,是一个非常非常有意义的变量。用这个变量预测票房的模型解释率也很高。像我们做试验看到的那样,预测普通国产影片的效果比较好,但是预测外国片子的票房,尤其是一些口碑好但却又小众的电影,效果则不佳,毕竟大家都会在网上看到高清版本。
0 4 、结论
大成就——
预测模型:
总票房=-81.538+0.334*宣发期百度峰值(66%解释度)
总票房=-424.247+0.514*百度指数映后一周均值(69%解释度)
💡宣发期百度指数峰值和百度指数上映后一周平均值,都和电影票房有着强相关关系,并且预测模型的解释率都达60%以上。
💡相比之下,百度指数上映后一周平均值对业内人士更有参考意义。电影上映后的百度指数越高,搜索电影的人越多,那么恭喜,电影的票房很有希望。但是本末倒置地去刷指数是没有什么意义的。
💡关心电影票房的朋友们,可以把百度指数上映后一周的平均值当参考,粗略估计票房,有个心理预期。
💡模型的局限性依然存在,有许多电影并不适用,所以…如果算出的数值很低,千万别灰心。
注:如果你想,迅速刷百度指数上去,加微信号:jipiiiii 了解。