刷量、播放量造假似乎已经成为影视行业的潜规则,有影视行业媒体曝出,电视剧行业每年花40亿购买收视率,造假早已成灰色产业链。

今年两会,著名主持人、全国人大代表曹可凡也发声痛批收视造假行为,“虚假的票房、虚假的点击率、虚假的收视率等,这些建立在造假基础上的大数据,严重影响人们对一部好作品的评判。”

收视造假的背后,对于制片方来说,意味着影视剧品牌的提升和商业利益的增加,但这会误导投资人和广告商的判断。

在这场博弈的棋局中,云合数据的CEO李雪琳选择了后者。

通过机器学习计算“有效播放量”

云合数据是一家专注于影视娱乐行业的大数据公司,它的一个最大的特点就是能根据视频网站和社交媒体等渠道呈现的信息算出一部影视剧的“有效播放量”。

云合数据CTO刘浩告诉创业邦,有效播放量的计算方法是:

第一,把播放量中的花序、预告片、剪辑等等都去掉;

第二,通过播放量曲线对比,机器自动通过异常识别技术,把异常量去掉;

第三,通过机器学习,把每一部剧的评论、点赞、弹幕以及在微博,微信,豆瓣等社媒平台的数据表现发给机器,同时把前台播放发给机器,机器自己建立这二者之间的关系,预估一部影视剧的播放量,筛除掉高出的异常部分。

但揭露播放量造假并不是李雪琳创业的目的。“通过有效播放,我们以它为标尺,能够准确地评估出参与每部影视作品的全部行业元素的历史价值,我们要做的是预测”,李雪琳告诉创业邦。

告诉制片方选谁、如何宣传效果最好

一个完整的影视制作周期包括如下的环节: IP的选择、购买、改编到影视作品,再到选导演、选演员、选编剧,拍摄剪辑;上线前进行宣传,运营粉丝,上线后看播放情况,来收集收视反馈,包括收视率、弹幕、评论等。

而云合数据主要参与到影视剧的生产和营销环节。

在生产环节,从前期购买IP,云合数据通过网络数据监测帮制片方规避抄袭的风险;在IP改编环节,云合数据通过机器读原文和机器搜集粉丝在网络上产生的一切反馈做汇总,来分析哪个人物,哪些情节,哪些对白最受粉丝的关注。从编剧的角度来说,也会帮助确定应该砍掉哪些人物,确定戏份该如何分布。

在选角过程中,云合数据能够通过影视圈明星个人大数据检索分析,给予导演一定的参考建议。在后期剪辑时,云合数据的分析模型对于剪成多少集,如何更新播放也会提供参考建议。

在这些方面,云合数据和《幻城》、《帝凰之神医弃妃》等IP剧集制作方都有过合作。

而在宣传推广环节,在剧集上线后,云合数据能够搜集各大影视网站的弹幕,用机器学习的算法分析出受众反馈的最热在哪里,最热的内容是什么,帮助宣发人员确定宣传的方向,匹配受众的反馈。

此外,云合数据通过对网络视频“有效播放”的分析,预测影视影视项目播放表现,为演员选择,投资,广告植入等早期决策提供支撑。

全平台的数据挖掘和分析能力是核心

云合数据CTO刘浩告诉创业邦,云合数据的技术核心是全平台、全量的数据采集能力,而市面上没有看到其他家在做,有一定的技术门槛,每天需要处理3T的数据规模;此外,云合数据在数据的采集与数据挖掘、机器学习方面是有比较强的技术优势。

云合科技CEO李雪琳是美国俄克拉荷马大学工学硕士,曾就职于爱立信售后,研发,售前部门;任东北亚区技术咨询高级方案架构师,中、美、欧十年工作经验;云合科技CTO刘浩,毕业于清华大学,曾任思科公司数据科学家、清华大学-思科联合实验室技术指导委员会成员。

2016年年初,云合数据曾获得永安基金千万元Pre-A轮融资。