
魔鬼就在数据中
众所周知,在信息技术领域,有个鼎鼎大名的摩尔定律,它认为集成电路上可容纳的元器件的数目,约每隔18-24个月便会增加一倍,性能也将提升一倍。初初看到摩尔定律的时候,真是感到欢欣鼓舞,18个月提升一倍,速度效率可以翻番,人类从此不就进入一个日新月异的时代吗?但是,随着信息技术的发展,我开始感到疑惑,越来越觉得这18个月的翻倍发展速度,也是一柄双刃剑,如果不能好好驾驭,所带来的破坏力也一样能让人瞠目结舌,就像本期我们所讨论的主题“互联网数据造假”。
互联网极大满足了人们的各种需求,提高了效率,这是公认的事实,推动互联网发展的过程中,一个核心的技术就是充分运用了数据的力量。在互联网快速发展的今天,对数据的获取、存储、分析都到达了一个前所未有的境界,“大数据”的威力横扫社会各个角落,数据因而成为个人、企业、乃至国家的核心资产。对于如此重要的经营资产,为什么会屡屡发生数据造假的传闻呢?
在本期封面报道中,编辑部列举了若干案例,从媒体、广告主和第三方公司的角度,分析了互联网领域数据造假产生的类型与原因。归纳来看,造假背后的推手来自这么几个方面:
第一,技术极大降低了造假的成本。在传统的电视收视率调查时代,如果要数据造假的话,还需要费劲收买样本户、伪造问卷等,既容易被识破,成本也难以控制。可是在互联网时代,数据造假很多时候就是敲敲键盘的事儿。代表网络身份的IP地址、电子邮箱、电话号码等都可以批量复制,造假者用一台手机就能模拟出无数台手机来执行各种刷量任务,更有甚者,有互联网媒体竟然直接从后台改数据。披上技术的神圣外衣,不仅造假成本低廉,且隐蔽性超强。
第二,资本追求利益和规模最大化的本能需求。对于投资方和广告主来说,媒体只有达到足够的规模才可能成为选择对象,对于互联网媒体来说,也只有提供足够漂亮的业绩数字,才有可能生存下去。于是,微博刷粉丝量,淘宝店铺刷订单量,微信公众号刷阅读量、刷赞、刷粉丝量,直播平台刷观看人数、刷打赏、刷评论,二手车交易平台、打车平台刷用户注册量……互联网媒体成为造假的重灾区,种种数据造假乱象的背后,是追求利益的永恒本能。
第三,迷信数据的社会文化风气。由于对数据的迷信,不仅媒体造假,就连广告主有时候也会成为造假的帮凶。比如,为了解决广告主面临的“一半广告费被浪费掉”这个世纪难题,互联网媒体祭出了“精准营销”的大旗,仿佛大数据可以无限提升广告效果。再比如,用数字说话的KPI考核,压力之下,广告主的营销人员甚至有可能主动要求媒体提供假数据来配合完成任务,KPI压力成了造假的一大动力。
在经过对互联网行业各角色的采访和资料梳理,分析出了各种原因之后,《媒介》编辑部却丝毫也没有觉得轻松,反倒是更加困惑。“水至清则无鱼”、“劣币驱逐良币,别人都在造假,你实话实说就会被淘汰”,这是在采访中经常听到的话语,让人不禁心生唏嘘。造假形势如此严峻,解决办法却捉襟见肘,仿佛人类面对人工智能的快速发展一样不知所措。在这里,笔者有几点思考。
首先,必须从全社会的思想高度认识到数据资产的重要性和数据造假的危害性。鉴于互联网所产生且拥有的巨量数据对于人类社会进程的越来越大的影响且深刻改变既有的社会结构,必须迅速有效地遏制日益蔓延的互联网数据造假问题,如果这个问题得不到解决,轻则破坏一个企业的发展,重则毁坏整个产业,最后,造成社会紊乱。当前业者要从维护自身产业发展的角度,重视互联网数据造假,强化反作弊的技术和机制,绝不能饮鸩止渴。
其次,鉴于互联网企业急速的集中化趋势,形成史无前例的数据帝国,有必要动用社会力量对此严加管控。互联网媒体是海量数据的掌握者,尤其是前几大公司,掌握了绝大多数的数据信息,也可以说是掌握了未来社会经济发展的命脉,他们有责任、有义务公开自己的数据、算法、原理,打通数据孤岛,让政府、民众、第三方公司能够合理有序的采集、存储、分析和使用数据。如果数据一直是黑箱状态,那就很难避免造假问题。
再次,第三方要真正承担起客观公立的监督职责。而要做到这一点就必须要改变数据行业的生存模式。第三方之所以屡屡犯错误成为数据造假的帮凶,究其原因在于分工的错误。现在,很多所谓的第三方公司既提供基础数据,也提供咨询服务,自己既当裁判员,又当运动员,这样的模式下不作弊都难,出现很多定制化的数据报告也就不足为奇了。而之所以会如此,就在于原始数据不值钱而咨询服务利润更高,第三方出于生存压力不得不为客户背书。为了解决这一问题,就需要在数据行业建立起隔离机制,就像出纳和会计必须分开一样,咨询服务和数据服务也应该是相互独立的,同时改变第三方公司的盈利模式,提高数据自身的价值。
数据造假实在是互联网这个新兴行业的巨大痛点,牵扯面太广,利益纠葛太深。对互联网来说,数据带来的不仅仅是光辉,更要警惕隐藏在光辉之后的魔鬼。这个魔鬼一旦放出来,破坏力将是无穷的。如果不能解决数据造假问题,导致信用荡然无存的话,互联网将从根基上遭到破坏,信息熵越来越大,最终变得一团混乱。到那时候,不用等人工智能、机器人了,人类自己就自我毁灭了。
所以说,魔鬼就躲在数据之中。一旦打开数据的潘多拉魔盒,人类社会能够控制自如吗?
无语。
|