Re: [问卦] 大数据分析与统计分析的差别?

楼主: grimmq427532 (Legend)   2017-10-18 12:42:56
我是觉得大家都讲得太复杂
还有讲到 Machine Learning , Data Mining , AI 的
统计说到底,就是由微观看巨观、由样本看母体
既然你现在数据很大,那推论这件事情就变的单纯的多
因为你样本多嘛,多到可以直接抓母体了,
不用很高深的机率推论、不用满足前提假设、不用在意实验设计
所以大数据重点就是你要怎么算的快、省资源
举个例子来说,
统计有太多太多实例要求你在 10 - 100 个样本之间
做最佳化、参数估计、分布估计嘛
但是做 Big Data 第一件发现的事情就是
干,资料塞不进内存
就算你塞进去了
干,Computing Power 不够
所以你就看到很多分布式运算、Cuda啊之类的
这边就比较像 ML 或 DM
AI 的事情,譬如说 Computer Vision 吧
不但要快、省,还要找到他妈的机掰的 Loss Function Minimum
那就更北烂了
跟 Big Data 不是同一件事情
作者: perlone (无名小卒一个)   2017-10-18 12:45:00
恩恩 跟我想的一样
作者: sampsonhugh (夏)   2017-10-18 12:48:00
欢迎善用主计总处信箱 https://goo.gl/bZDKUu
作者: zzzz8931 (肥宅)   2017-10-18 12:49:00
好的
作者: saufu08 (saufu)   2017-10-18 12:49:00
我看的懂你写的跟我想的一样
作者: zx3393 (鲁至深)   2017-10-18 12:52:00
嗯...你不懂统计,只会应用,然后再从应用逆推统计原理结果就是,讲错了。
作者: rosenzulu (玫瑰祖鲁)   2017-10-18 12:52:00
这篇简洁有力 推
作者: abramtw (世界原来是如此耀眼啊)   2017-10-18 13:00:00
阿不就一阶倒数等于零 二阶大于零就好了
作者: laba5566 (最爱56家族 啾咪)   2017-10-18 13:06:00
一堆loss fun不可微 没有二阶倒竖 楼上就GG惹
作者: chen1025 (小陈)   2017-10-18 13:24:00
作者: xxx741789 (xxx741789)   2017-10-18 13:51:00
最近在学这个推一下

Links booklink

Contact Us: admin [ a t ] ucptt.com