大数据的定义就是
收集到足够多的资料就叫大数据
大数据难的不是资料量
难的是你要用什么样的数学模型
去知道某两笔以上的离散数据
有到什么样程度的关系性(依不同的数据有不同的检定方式)
※ 引述《ilovedandan (欧阳妮妮忠实热血粉丝)》之铭言:
: 最近新闻上真的很常看到这个名词 Big data
: 身边的人也常用到这个词
: 但有点想问统计跟大数据有什么不一样?
: 因为总觉得现在人家口中说的"big data"
: 不过就是一般个人电脑用EXCEL就跑得出来的统计结果而已吗?
: 那跟以往的统计有啥不一样?
没有不一样,大数据分析就是用统计分析
: 毕竟一般人能取到的数据库就这么大而已
: 而且分析出来就跟以往一样,最后也找不出什么因果关系
个人问题
: 但报告的时候讲出Big data好像很厉害耶
: 所以实在很好奇这两者有什么不同
巨大量的数据你硬要分析其中的前因后果,理论上做的到
但通常都是npc以上的难度
除非量子电脑实作化,不然以人类有限的资源无法做到这件事
回到大数据的分析方式
你要用什么样的数学模型,用什么样的检定指标?
大家都知道资料量只要足够多,就可以有一定信心水准的准确度来
做到未来预测一件事到一个门槛准确度
问题是how to do this? how could it be?
巨大数据分析的定义是足量的数据
足量的数据是足量以分析到所需准确度以上的的足量
所以我反问你,你需要多大量资料去统计? 你要用什么指标去分析? 然后达到多准的预测?