何为大数据
- 2012/12/27 10:08:29 作者: 来源:UPS应用
-
乍看之下,“大数据”似乎是指由个人和企业所产生的海量的数据。日渐便宜的存储使得收集的大量数据成为了赚钱宝库,为那些有能力通过筛选做出正确的连接的人们创造了赚钱的机会。多数预测表明,未来的数据量都将非常庞大
乍看之下,“大数据”似乎是指由个人和企业所产生的海量的数据。日渐便宜的存储使得收集的大量数据成为了赚钱宝库,为那些有能力通过筛选做出正确的连接的人们创造了赚钱的机会。多数预测表明,未来的数据量都将非常庞大。
这样,您将再次听到类似于“您需要大数据”这样的宣传标语。如果您的企业的IT部门已然具备了一定的规模,那么,其实您已经有了大数据了(在这个意义上,您已经有了很多的存储信息,您可能只是不知道能够利用它们来做什么)。在这种情况下,“大数据”的真正意义在于要对大数据进行分析,利用相关的工具和策略,从大量的储存数据中收集有用的信息。但由于大数据分析很绕口,大多数人只是说“大数据,”而他们真实的意思是指通过背景分析大量数据资料的处理能力。
最后,到底是“bigdata”还是“BigData”?这其实是通用的,即使IT专业人士喜欢使用他们专业领域的特有名词,让我们坚持采用小写版本的吧。
大数据中的“大”
《纽约时报》(《大数据时代》一文)指出,“绝大多数的大数据都是杂乱的:包括文字、图片和网络上的视频以及传感器数据流。它们被称为非结构化数据,通常不利于传统数据库的存储。”非结构化数据,如视频,一般不提供一个人和物的清单,使分析变得很困难。即使基于文本内容,如电子邮件可能也是很难筛选,特别有些拼写错误,语法不正确的句子,随机的缩写和其他一些写作怪癖,所有这些都会使计算机分析过程异常(尽管人工进行分析可能通常没有困难)。
这种结构的缺乏使许多可用的数据无法使用传统的(数据库驱动)技术进行分析。但潜在的好处是推动企业采用大数据分析技术对这些数据进行深入了解。例如,进行有针对性的广告,便是一种应用程序。面部识别算法,可以识别特定商店的特定购物者,使企业能够使用监控摄像机的图像,特别针对这些定的消费者提供相关的特定广告。而且,一些政府机构(如执法部门)也可以利用其众多的优势,在特定的社交网站(如Facebook)实施大数据分析和汇编众多的个人信息。
隐私问题
关于大数据分析的一个主要关注的方面是隐私。由于人们随心所欲的将大量的私人信息通过互联网上传到社交网站、博客和其他论坛。虽然很多人都至少意识到保持适当的隐私设置的重要性,但是,人们通过Facebook还是可以详细了解别人的生活情况,而这些信息可能很容易被滥用。
但随着视频监控、电子金融交易和其他电子记录的日渐普及,几乎您所做的一切在某种程度上都是公开的,减缓数据流几乎是不可能的。虽然有很多的大数据分析的讨论确实不涉及隐私,但并不是每一款大数据应用程序处理敏感或私人数据时都会引起注意,隐私的威胁仍然是连接到大数据的一个重要的问题。
结论
大数据,或许更准确地说大数据分析是试图从日益泛滥的个人和企业所创建的数据中处理和搜集有用的信息。这些数据是非结构化的,也就是说,它们包括电子邮件、图片、视频和其他信息,不能轻易进入数据库模型。因此,企业进行大数据分析所追求的目标是寻找这些数据可以提供可用的信息,处理搜索的潜在利润的其他方法。大数据是炒作吗?不一定,关键在于其能否真正为企业带来效益。但是,大量的数据,特别是在IT媒体中,我们建议您需要谨慎评估对于大数据潜在的巨大关注。而且,但涉及到人们的隐私时,大数据也应当是一个需要严肃处理的问题。