大数据(英语:Big data),又称为巨量资料,指的是传统数据处理应用软件不足以处理它们的大或复杂的数据集的术语。大数据也可以定义为来自各种来源的大量非结构化或结构化数据。

专业术语就不多说,说多了不仅看不懂还困,小编先来举例说明:

2016年3月,能下围棋的电脑程序”AlphaGo(阿尔法狗)”以四比一的成绩战胜了世界冠军李世石,为什么电脑程序会这么厉害呢?这其中就是大数据的功劳了,科学家先让它学习了人类高手的十万盘棋谱又让他下了三千多万盘棋,因此它积累了非常丰富的经验,而这几千万盘棋的相关数据就是大数据的一种了,简单来说大数据是指那些量大且复杂到无法用传统数据处理方法来处理的数据集合,它具有四大特点:

特点一:体量大,大数据是使用数据全体进行研究,所以它的体量大到远超我们的想象,以2013年为例,人类全年共生成了4.4万亿GB的数据,如果用容量最高的iPhone存储这些数据,将需要340多亿台iPhone,如果把这些iPhone一个个叠放起来其厚度相当于19个地球了!

特点二:类型多,大数据不仅仅是文字,还包括我们上班、上学、停车、住址、就餐的位置信息,另外我们上传到朋友圈的照片和短视频,微博,抖音等等这些里面的数据都可以算做大数据的一部分。

特点三:速度高,大数据的产生和处理速度都非常高,比如我们常用的微信最多的时候一分钟能够生产一千万条信息,要想把它们在这么短时间内一起发送出去,着实是件不简单的事情呢。

特点四:收益广,通过对大数据的分析和挖掘,我们能够让它创造价值,比如说假期出去玩的时候,在过去确定旅游路线是件很烧脑的事情,而在大数据时代,相信很多人都在享受它带来的便利,我们可以收集前辈对各个景点的评价和介绍自动规划出一条最方便的旅行路线。

看完这些有同学肯定觉得,原来大数据就是那些很大的数据咯?

然而非也,并不是所有看上去很大的数据都是大数据,举个栗子来说:

像我们中国每十年都会进行一次全国人口普查,统计我国各地人口的数量、年龄、性别等信息,这也会获得海量的数据,这些数据产生的速度很慢,类型少,通常使用传统数据处理方法就能够获得想要的结果了,所以并不能算大数据。

最后小编再总结下传统数据和大数据的区别

传统数据:在大数据出现之前,非常依赖模型以及算法。人们如果想要得到精准的结论,需要建立模型来描述问题,同时,需要理顺逻辑,理解因果,设计精妙的算法来得出接近现实的结论。因此,一个问题能否得到最好的解决,取决于建模是否合理,各种算法的比拼成为决定成败的关键。

大数据:当数据足够多的时候,不需要了解具体的因果关系就能够得出结论。

举例一:大型超市把黄瓜和茄子组合在一起卖,超市可以并不了解这么做的原因,只需根据他们数据库中记录的顾客购物习惯分析,从而出现了这种组合,就这么简单。

举例二:我们常用的Google 在帮助用户翻译时,并不是设定各种语法和翻译规则。而是利用Google数据库中收集的所有用户的用词习惯进行比较推荐。Google检查所有用户的写作习惯,将最常用、出现频率最高的翻译方式推荐给用户。在这一过程中,计算机可以并不了解问题的逻辑,但是当用户行为的记录数据越来越多时,计算机就可以在不了解问题逻辑的情况之下,提供最为可靠的结果。

生活在这个时代,其实我们无时不刻不在使用大数据,而大数据也在不停的影响着我们的生活,希望这篇文章能让大家对大数据有一个更好的了解!