你必须知道的7个大数据定义
在大多数人根本不知道什么是大数据的时候,不可否认的是,大数据已经在21世纪掀起了惊涛骇浪。根据IDC(国际数据信息公司)的分析,这个世界的数据正以每两年翻一番的惊人速度增长。理解大数据,如何利用海量数据,成为大家关心的重点问题。
虽然大数据的定义不同,但基本上,大数据领域的所有人都认同,大数据不仅仅意味着更多的信息。本文梳理了七个重要的大数据观点。希望大家不要只看大数据的皮,也要从不同的角度去审视大数据。
1)大数据最基本的定义是原始大数据。
大数据的3Vs定义是迄今为止最受尊敬和最广为人知的说法。3Vs由Gartner分析师Doug Laney于2001首次提出,分别代表数据量、数据传输速度Velocity和数据类型多样性。此后,人们在3v之外又提出了更多的“V”,如保真、有效、价值、可见性等。,其中保真是最被广泛认可的。
3Vs的定义在上一篇文章里已经详细介绍过了,这里就不赘述了。请参考《大数据时代,用“大、快、杂、疑”的谚语带你认识大数据》。
2)作为技术的大数据。
大数据并不是一个全新的概念。几十年来,CERN的科学家们一直在处理每秒PB (Peta字节)的海量数据。那为什么“大数据”这颗子弹直到近几年才扔进科技圈,大家都被大数据轰炸了?
现在要处理的数据量更大,数据生成和处理的速度更惊人,数据来源更多样,所以处理和存储大量数据的新技术和工具发展很快,比如开源软件Hadoop和NoSQL数据库。新技术诞生后,开发者和用户都需要一个技术名词来区别于以往的技术,于是“大数据”这个名词应运而生。
所以大数据不仅仅指数据,还包括这些用来分析和处理海量数据的新兴技术。
“大数据是帮助我们找到相关数据并分析其含义的新工具。”
3)大数据是不同的数据类型,大数据作为数据差异。
今天的“大数据”所涉及的数据与过去不同。据Horton works 1战略副总裁肖恩·康诺利(Shaun Connolly)介绍,过去的数据大部分是手工记录的交易,现在是机器为我们记录的交易数据;此外,还有人与物、企业之间的交互,比如人在互联网上点击网页和链接的记录;最后还有机器自动生成和积累的观测值,比如智能家居产品记录的室温变化。
因此,Shaun Connolly将大数据定义为由交易、交互和观察数据组成的数据类型。
“大数据=交易+互动+观察”
4)大数据作为信号。
SAP高管史蒂夫·卢卡斯(Steve Lucas)不是从数据类型的角度看待大数据,而是从意图和时机的角度。以前企业收集的信息只能在事件发生后作为参考,而现在企业收集的信息是“新信号”2,可以在事件发生前得到前兆和暗示,进而采取行动影响事件的结果。举个例子,如果社交网站上某个品牌广告的“赞”数和点击率跌到谷底,公司可以预期接下来的产品销量会很可怕;同样的情况,过去公司得到的数据是产品发布后的销量。
“大数据是新的信号。”
5)大数据就是机会大数据就是机会。
451 Research的数据专家马特·阿斯莱特(Matt Aslett)将大数据定义为“以前由于科技的限制而被忽视的数据”。这个说法也得到了很多人的认同,因为大多数人说的都是这些以前无法分析处理的数据。
“大数据是以前由于技术限制而被忽略的数据。”
事实上,他在文章中并没有使用大数据这个词,而是使用了“暗数据”。事实上,许多公司使用“暗数据”这个词是因为当数据变得“暗”时,就意味着错过了信息,错过了机会,留下了企业战略的盲点。一直以来,企业聘请数据专家的目的都是为了“照亮黑暗的数据”,观察以前从未注意到的趋势,做出更全面的考虑。
因此,SAP的一项调查显示,近76%的企业高管将大数据视为“机遇”。我个人也喜欢这个观点。毕竟现在公司都在推广大数据,希望能掌握全面的信息,抓住这些机会!
“SAP的一项新调查表明,近76%的高管将“大数据”视为机遇”5
6)大数据的哲学定义:作为隐喻的大数据
著名摄影师兼出版人,曾任《时代》、《生活》和《国家地理》杂志摄影师,曾负责史上最大摄影项目的里克·斯莫兰(Rick Smolan)在其著作《大数据的人类面孔》(The Human Face of Big Data)中,对大数据给出了完美的哲学定义——“大数据是帮助地球构建神经系统的过程。在这个系统中,我们(人类)只是其中一个传感器。」6
“大数据是帮助地球发展神经系统的过程,在这个系统中,我们只是另一种人类类型的传感器。”
很深,对吧?如果你读过《大数据的人类面孔》这本书,我相信你应该对这个比喻点头。
7)大数据是旧事物的新噱头,大数据是旧事物的新术语
有人认为“大数据”这个词已经被严重滥用,大数据只是商业智能或商业分析进化后的新词。