大数据无处不在,大数据无所不能,大数据无往不利。似乎祭出大数据,一切问题迎刃而解。大数据果真这么美好?即使它真的如此神奇,我们对它的把握又处于何种阶段?笔者以为,我们对大数据的理解和认知存在很多误区,不妨辩上一辩。
数据与体量之辩:大数据的积累和运用是渐进过程,“小数据”亦不容忽视
大数据背后有很多量化指标。按照4V的标准,大数据已经从TB跃升到了PB级别,继而对数据处理的软硬件支持提出了非常多的要求。以此衡量,称得上拥有大数据的公司,实在寥寥可数。
在这样的话语体系下,很多媒体走向极端,一方面,认为只有大数据才有变现的可能,自己的数据毫无意义,不去挖掘现有的数据中隐藏的价值;另一方面,认为自己不具备数据的基因和能力,根本不去思考如何根据既有的基础、收集整合更多数据,探索适合自身的商业前景。
实际上,任何一家媒体都有非常多可资利用的数据,对大众媒体而言,客户需求、用户反馈这些数据从来没有停止过积累,并完全可以用来指导新渠道的建设和新业务的开发。对行业媒体、区域媒体而言,长期在细分领域内的摸索,所沉淀的各种资源亦完全可以通过数据的形式做纵深扩展。
比如电视台,一直以来用收视率衡量内容、指挥广告,这本身就是数据运营的思路,当然,这是一种适合过去电视生态的、简陋的数据思维。今天电视台动辄运营数百个微博账号、数十个微信账号、各类APP和视频网站,如能将传统电视收视率、微博、微信的粉丝行为数据、视频网站用户情况等数据打通、分析,用于指导内容的制作、版权的购买、频道及网站运营乃至广告新品开发,有什么不可行呢?说实在,这些数据加起来,未必能够达到每日PB的层级,或许算不上科学定义中的大数据级别,但是不能否认其价值巨大,值得挖掘。
即使是惯常被看做大数据公司的谷歌、苹果、亚马逊、BAT等,其日常工作中,也总是小数据处理为主,而非所有人都直接对海量数据进行分析。
喊多了大数据的口号,将眼光放得过于长远,容易无视现有的数据资源。说的再直白一点,媒体不应该将发展缓慢归结于缺少“大”数据支持,如果连现有的小数据都无法把握,面对大数据只能是更加无从下手。
数据与营销之辩:新媒体环境下的营销离不开数据,但数据不是所有问题的答案
广告界有这样一句话,“我的广告费有一半浪费掉了,但我不知道是哪一半”。在诸多精准营销公司的宣讲PPT中,往往将这句话作为开场白,继而展开论述自家“大数据”技术对这一问题的完美解决。
不得不承认,大数据的确部分解决了这一问题,如RTB一类的广告模式,能够在毫秒级的时间内对消费者的行为做出响应,实现广告的精准推送,并触发购买行为,自有其价值所在。
但笔者以为,广告界的这句话本就是一句伪命题。其背后隐藏着的逻辑是:只有当投放带来当期、等值的销量提升,才意味着广告费没有浪费。然而实际上,广告投放的效果是累积、渐变的,包含了消费者心理效果、行为效果、传播效果等多个层级,而产生的品牌效应等层面的价值提升,更不是简单的数据可以衡量。
但是大数据这一概念和类似RTB这种精准营销模型的出现,使得现今营销界俨然陷入了一种数据狂热,试图将所有的投放都框到现有的数据架构里,而不能框进去的营销手段,就选择性无视或者贬低。传统广告已死,就是这种论调的典型代表。
我们来看一个实际案例。在笔者走访的过程中,与阿里妈妈的负责人进行过沟通,他们提及,在淘宝平台上成长起来了很多销量千百万的原生品牌,他们正面临着品牌建设的考验。然而长期以来淘宝提供给广大店主的数据营销工具,培养了他们根深蒂固的ROI、CTR思维。在这种思维的指导下,陷入了降价求销量的死循环,无暇、无力进行品牌建设。怎么办?
当传统媒体的营销效果无法纳入到既成的大数据体系中,他们被忽略了,这是令人遗憾的损失,因为既成的体系根本就没有解决、也不能弥补传统媒体在品牌建设、告知方面的价值,而市场上对品牌的呼唤又持续存在,那怎么办?还是要回过头来,重新审视我们的价值体系,重新审视我们的营销架构。
不能否认,当下的新营销环境离不开数据支持,但也必须要说,现在的大数据,是不全面、短视甚至有些病态的大数据,不足以支撑新营销的需求。
真正的答案,应该是新的、全媒体营销的架构。
数据与业务之辩:业务盘活数据,而不是数据驱动业务
当数据越来越海量,我们能够通过数据认识市场需求。但是如何从海量数据中选择出有效内容,继而对有效数据进行精细分析,从而为业务所用,这是媒体运营者的价值和职责所在,而不是数据和技术力所能及。
很多媒体运营者一听到“大数据”这样的概念,脑中浮现出的往往是繁复的算法和冷冰冰的服务器,并感到畏惧。实际上,媒体运营者身为一线的业务员,应该主动去利用业务优势盘活数据资产,而不是反过来,让数据去驱动业务。
原因无它,唯有媒体运营者才最了解市场需求,最能够看到业务和数据的契合点。谈及大数据的例子,Netflix《纸牌屋》总是很容易出现在人们脑海,被视为数据驱动业务的典范。事实上,在Netflix全站运营过程中,设定六万多个标签的规范、以及对每一个视频内容打标签、再到某部电视剧拍摄过程中的选角、剧本修改等等,都是由编辑操盘,而不是交给机器决策。
不可否认,在大数据处理上,技术人员通过算法,能够过滤、分析出具有指导意义的结论,前提是媒体运营者给技术和数据一个方向。不然,指望计算机专业背景出身的数据工程师提出在内容和营销上具有建设性意见的数据处理意见,无异于痴人说梦。让一盘散沙的数据聚拢到市场和业务的内核上,这绝非他们的特长。
当然,要想让业务驱动数据,媒体运营者们还需要补课,让自己真正具备直面数据、操盘数据、融汇数据和业务的底气和储备。
数据与开放之辩:数据带来权力,同时意味着责任
数据带来媒体格局的变迁。无论在国内外,已经有几家公司逐渐站到了数据的制高点,凭借在数据方面的积累、处理能力,拥有了媒体领域内强悍的话语权。
比如搜索引擎掌握着网页排序的规则,对中小媒体可谓生杀予夺;比如电商平台掌握着用户交易数据,更试图进军物流、金融等领域,在线上线下交易中深深扎根;又有大型社交网站,成为社交数据托起的无所不在的帝国,几乎涵盖网民生活方方面面的需求。在垂直领域,视频网站、内容推荐网站等等,也正在加快凭数据换权力的步伐,试图成为小平台。今日头条即是一例。
平台既成,相关的规则随之而来。表面上看,这是大平台可以自说自话,然而,凭借数据获得了权力,对数据生态就负有责任。对数据进行开放和共享是必然选择,否则就只能是不可持续的暂时垄断。
比如视频网站在后端聚拢了包括专业制作、用户自制等海量内容,前端聚拢了海量用户。对内容供应商而言,他们没有直接的渠道获得海量用户的大数据,但他们需要这些数据的支持。对视频网站而言,他们不直接从事生产,供应商是根本依托,就应该让这些数据为供应商造血。将所有数据都紧紧捂住,毫无意义。
事实上,媒体平台确实是在摸索数据开放的路径。另一个问题随之而来,数据开放的基础,在于平台自身的数据处理能力。如果自己尚不具备大数据处理的条件,即使开放了,对第三方的帮助也极其有限。身为平台,不事生产只是表面,至少要能够成为一个大数据的“中央厨房”,为平台的依附者提供足够多且灵活的支持。
数据与现实之辩:国内外数据处理能力仍有差距,不应盲目乐观
承接上文,说到数据处理能力的问题,目前国内的大平台,能力几何?与海外相比,差距几多?
从数据库概念开始,中国的媒体就在跟着国外的步子走,至今SQL、Oracle还在中小型数据库中广泛应用;而大数据时代,绕不开的Hadoop集群、MapReduce引擎等技术源自谷歌实验室的开发项目。这些数据处理的基层应用,国内公司少有作为。
在最上层的数据可视化部分,2013年5月,专门研发数据分析及可视化软件的Tableau Software在纽约上市,融资2.5亿美元,市值达到20亿美元。该公司的主打产品Tableau Desktop支持多种数据库,可以对数据从时间、空间、关系等维度进行便捷的可视化分析,而国内根本就没有出现类似的公司。至于百度、腾讯等公司开放提供的数据图表工具,还只是相形之下堪称原始的柱状图、饼图、折线图等套件。
在中间的数据分析、应用层面,对于海量数据,我们的几大平台又有何作为呢?苹果在最近推出的iOS 8中内置Health Kit应用,试图用数据重整医疗;彭博社的财经数据终端,每年收入达到30亿美元;Netflix为全站视频内容打的标签接近七万,拿得出《纸牌屋》这样响当当的作品,而优酷、腾讯视频、爱奇艺,这些背靠巨头乘凉的视频网站,拿得出什么内容?
或许中国只有凭借网民数量优势而带来的数据量上,堪与国外公司一拼了。用户动辄上亿,数据更是TB、ZB、EB、PB……,数据中心遍地开花,热火朝天的景象背后,再看实际成果,目前不外一些重在可视化的预测报告、数据新闻和夺人眼球的数据跨界概念。
笔者无意否认大数据的价值,然而数据价值的浮现,有赖于纵深层面的很多功夫,就拿数据医疗为例,医疗本身牵扯繁复的链条,政府监管、医院、药房、医保、可穿戴设备等等,林林总总的数据如何统一,又如何在应用过程中保护用户隐私?这些不落在实处,数据医疗也就是个空中楼阁。多问一句,有没有人在做这些落实的功夫呢?
大数据是一片汪洋大海,有的是发展空间,但一个猛子扎进去,入水的姿势尽管优美,能不能再浮上来,那就要看各人“造化”了。