[MYBO 首页]
登陆博客 注册博客  
老农  人气量[6791849]
个人首页 | 管理博客 | 我的文章 | 我的相册 | 我的圈子 | 我的视频  
 
MYBO broadcast
search
 
个人简介
 
姓名:hsm
 
简介:注册之后就才能回复我的文章
八月号《媒介》:阴阳两面大数据

 

魔幻化的“大数据”

 

大约就在2012年,程序员出身的涂子沛出版了名为《大数据:正在到来的数据革命》一书,以科普方式介绍了大数据的由来与变革趋势,成为社会各界关注大数据的重要启蒙。也正是在那一年,《媒介》编辑部推出了主打文章《大数据,新天地》,详尽介绍了大数据的由来,作用与未来趋势,成为媒体专业期刊中探讨大数据的第一刊。

其实,从创刊以来,编辑部从没忽略数据收集数据分析对于媒介经营的价值与功效。早年间,我们关注的是收视率调查,受众调查,后来是有线数字电视中的海量数据监测和专业数据公司的产业链,两年前则是所谓的大数据。本期重提大数据主题一方面是因为注意到业界对于大数据的热情分毫未减,另一方面也是在热潮之中冷静地看到了这股潮流的方向出现了一定 “魔幻化”的偏颇。在此,笔者向诸位看官提供几点参考:

第一,数据量的由小到大是一个渐进过程,而非突然爆发。涂子沛在接受《生活周刊》时表示,在美国,上个世纪80年代就有人提出“大数据”的概念了,到2000年,由于信息系统的累积作用,人类的数据开始大量增多,有不少企业的数据级进入到“太”(terabyte)的级别,学术界就开始尝试给多少为“大”进行定义。起初流行的定义是“200太就是大数据”,只是没想到,随后数据量更以一种更加迅猛的几何级速度递增,这才有了我们今天所认知的“大数据”。事实上,人类文明的构建一直都与数据息息相关。人类从数据到信息再到知识、智慧并以此解决问题的操作方式自古有之;数据处理也随着数据量、数据处理要求的改变,经历了从数据仓库、联机分析、数据挖掘、数据可视化到大数据的自然过程;数据运用于各行各业同样并不新鲜,在自然科学、金融、医疗、农业等诸多领域的运用历史、成熟程度都远超人文科学领域。只是,到了今天,我们可以用更加方便、低廉、容易的方式去获取数据、处理数据,并将之运用于更多人文科学、社会科学的领域,让大数据与普通人们的生活有了更加紧密的联系。这当然是一种极大的进步,但是这种进步是一种积累和渐进的过程,而不是忽如其来的风暴。由此,也奠定了我们对待大数据的基本态度——盲目追捧、过度神化都不必要。

第二,大数据是有效的但不是万能的。谁也不能否认大数据技术的有效性,但是正如人类数据处理历史的演进过程那样,数据处理的技术和理念永远赶不上数据自身的变化速度。到了今天,自然界与人类社会的数据量增长程度超越了任何一个年代,摩尔定律的作用之下我们甚至很难去想象未来数据量的成长规模需要用怎样的新单位去计量。与此同时,数据成长的速度,数据的类型也都对数据处理技术提出了极大的挑战。从目前的技术发展来看,我们能够掌握、存储、管理、分析和运用的数据还只是沧海一粟,甚至分析能力虽然有了极大的提升却仍然无法匹配数据的量级和种类,技术的滞后是一种必然结果,也是一个客观事实。事实上,在很多领域中,数据分析技术的滞后性让我们得到了大量的数据垃圾和数据冗余,盲目地追捧所谓的大数据技术,或者偏执地信任大数据技术的处理结果,反而会在一定程度上妨碍我们对数据信息的掌握,影响我们做出准确的判断与明智的决策。数据从来都只是我们做决策的参考,虽然这种参考很重要,但绝不应当是人类决策的全部。

第三,平台和数据体现的是科学精神而不是花哨的魔幻效果。在今年早几期的杂志中,我们讨论过互联网本初精神,也谈论过互联网思维,当时就曾经指出,互联网的核心是强调开放和互动,而数据和平台是大部分互联网机构的运行核心。这个说法其实互联网自身也是承认的。马云说互联网打破了信息的不对称性格局,竭尽所能透明一切信息;对产生的大数据进行整合利用,使得资源利用最大化;互联网的群蜂意志拥有自我调节机制。这些都与我们所说的数据+平台的互联网核心相契合,只是,当这些要素被“金融”二字所控制,当一切的标准是为了更快、更大的“盈利”,那么平台和数据就难免沦为了路演中的魔幻剂,穿上了商业化的投机性外衣。当互联网的开放与互动被打破,走向了封闭和垄断,异化就不可避免;当数据和平台所成就的海量、迅速、可寻址不再是科学主义的抓手,而是资本路上的点金术与魔术棒,互联网的扭曲发展就再难否认。我们可以先不讨论国外的情况,至少在国内,互联网机构正集体利用大数据技术为广大受众编织一场华丽的幻梦,以掩盖幻梦之下追求真金白银利润至上的商业逻辑。

第四,互联网的数据帝国是不是真如宣传中那样光辉雄伟壁垒坚实?BAT为首,越来越多的以互联网为代表的传媒机构号称自身掌握了海量数据,以数据指导业务、设计产品、决策内容、重构商业模式,甚至开创了新的技术壁垒,可以与所有竞争者相区隔。然而从笔者的角度来看,一来这些数据的“海量性”与“准确性”存疑——国外有政府部门统一管理公共数据,并做了大数据的开源与保护处理,国内本就不具备这样的现实;数据量级最大的BAT三者之间的数据也从未共享与开源。那么,单凭亿级用户的网络行为构筑成大数据基础,其实是有违大数据本身“数据库之间可以实现自由流动与关联”的准则的。因此,在我们承认互联网上数据海量,并可以尽量还原用户真实需求的前提之下,这种数据库与数据库之间的隔离、竖井的现实存在也是不可抹杀的。再者,平台化、数据化都不是寡头帝国独有的核心科技,至于所谓的壁垒与区隔,如果没有真正的核心技术,其实也不过是一座空中楼阁。

第五,互联网的大数据泡沫已经逐步显现。从最近几年传媒业的发展轨迹来看,当一个事物被追捧到极致,其出现泡沫的可能性也就不可避免地被提升了。比如早年间的互联网金融泡沫,比如影视业的投资泡沫,再比如目前已经初显雏形的大数据泡沫。想必大家都还记得央视315曾经曝光的内幕,以百度为典型代表的互联网Cookie运用会极大地威胁用户的数据安全与隐私信息保护。百度在普通消费者手机中的预装软件高达6款之多,几乎涵盖了百度手机端的全部产品线,包括:百度搜索、百度手机助手、百度浏览器、百度优化大师、百度好123、百度地图等等。尽管工信部宣布从2013111日起,就要求生产厂商公示手机中的预装软件等基本配置信息。但是对于百度这样通过第三方来预装软件还缺乏有效的法律法规监管。而这也只是互联网寡头大数据运用与用户数据安全保护悖论的冰山一角。

与国外政府、机构在数据技术开发上所奉行的“挖掘越多,保护越多”的准则相比,中国目前的大数据运用在一定程度上是踩着监管的红线,钻了法律的漏洞行进着的。当然,这种行为并不仅限于互联网、媒体产业,在金融、医疗、通信等几个重点行业,此类问题层出不穷,互联网圈也只是其中之一。然而,正如国家管理层终究将鞭责伸向了盗版、盗播、海外视频内容引进、OTT TV竞争乱象一样,迟早有一天,互联网寡头赖以为生存根基的大数据也会成为管控的核心区。到了那个时候,如何在不侵犯用户隐私信息的前提下保住现有的垄断性地位,维持住高楼广厦不倒,笔者以为,这是一个很难也很重要的问题。互联网很美好,互联网也很危险,到底是热情拥抱还是警觉远离,还需冷静思考。

 

斯诺登扯开了一个关于数据安全的口子,直指互联网数据安全背后的政府黑幕。而最近苹果的后洞门则让无数粉迷如同五雷轰顶。如果偶有信息的点滴泄露,人们还能将其视为无意的“漏洞”,睁一只眼闭一只眼的予以原谅。然而,当个人消费者的所有信息在无告知的前提下赤裸裸地被企业盗取、截获、掌握,就无人能够淡定的坐视不理。

人在做天在看,这个“天”正是大数据,它可能是上帝,也可能是撒旦。

  [ 上一篇日志 ]   [ 下一篇日志 ] 浏览 [2045] 评论 [1] 发表时间 [2014-08-04 07:00:03.0]  
 

回复
 hsm [2014-08-04 07:04:31.0]
当众声喧哗之时,我自独唱;当众身匍匐之时,我自独立;当众脑迷茫之时,我自独思。这就是《媒介》,独立,自主,理性,包容。

共有回复1个 共1页 1


手机认证弹窗

身份验证通知

公安部网安大队要求,

您需要身份验证后,

才能进行此操作!


关于我们 | 版权声明 | 联系方式 | 广告合作 | 问题咨询
Copyright 2007 @ Mybo.com, All Right Reserved. ICP证:京ICP备11006598号-3