统计是数学的分支
都有它的前提和假设
譬如回归要符合常态性,独立性,同质性
但是实务上 99% 的人根本不想管也不懂这些数学假设
只想随便丢一堆资料让电脑跑
就说自己是专家
于是各种资料探勘方式就出来了
后来实务上又发现另外一个问题
实务上 99% 都不是结构化资料
统计上还要整理资料,删除离群值或missing value等
对这些专家太麻烦了
它们就只是想把一堆垃圾资料丢到电脑里面做而已嘛
有的甚至只是声波
于是一堆垃圾全部丢进去就变成大数据了
※ 引述《rosenzulu (玫瑰祖鲁)》之铭言:
: 大数据
: 最近被媒体使用到烂掉的名词
: 常常看到新闻“大数据显示...”
: 身为统计系的我 也稍微爬文了解一下
: 大数据的魅力所在
: 但看到的不外乎是
: “未来产业大宗就是AI、物联网与大数据的结合”
: “运用大数据分析得到相关 进一步得知未来趋势作为政策”
: 但如果是要探讨相关性、做预测
: 使用统计方法不是也可以吗?
: 再查一些大数据最夯的课程
: 几乎都是R,Python这2个程式语言
: 然后使用该2语言实作资料探勘、机器学习
: 实在搞不懂大数据的新科技点在哪里
: 有没有产业界大数据大师可出来为小弟解惑?