Re: [问卦] 大数据分析与统计分析的差别?

楼主: Joker3 (丑角3)   2017-10-18 08:53:41
※ 引述《rosenzulu (玫瑰祖鲁)》之铭言:
: 大数据
: 最近被媒体使用到烂掉的名词
: 常常看到新闻“大数据显示...”
: 身为统计系的我 也稍微爬文了解一下
: 大数据的魅力所在
: 但看到的不外乎是
: “未来产业大宗就是AI、物联网与大数据的结合”
: “运用大数据分析得到相关 进一步得知未来趋势作为政策”
: 但如果是要探讨相关性、做预测
: 使用统计方法不是也可以吗?
: 再查一些大数据最夯的课程
: 几乎都是R,Python这2个程式语言
: 然后使用该2语言实作资料探勘、机器学习
: 实在搞不懂大数据的新科技点在哪里
: 有没有产业界大数据大师可出来为小弟解惑?
之前我去中国谈生意的时候
跟几个上海和杭州共享自行车的业者谈过
我当时有问他们为什么他们好像对共享自行车的管理和回收比较没那么在意
(就之前中国共享自行车到处乱丢 被po上网那阵子)
他们几乎口径一致地说
共享自行车其实不是要赚钱 而是要蒐集大数据
例如杭州的共享自行车有30几家
其中大概有一半其实是同老板
他在不同单位和机构用放不同的共享自行车
对了 先说一下杭州的共享自行车租用模式和之前台北市有点接近
就是半小时还多少时间内不用钱
所以导致游客都会在时间到之前就还车
一个景点一个景点还车 再借车这样
总之共享自行车的老板会在车上放定位器
纪录数十万辆自行车的旅线
长期累计下来
就会知道那些地方是旅客最常去逛的点
哪些是通勤族最常走动的地点
哪些地方需要增加停车位
又哪些地方适合开设商场
这些数据蒐集完 经过整理之后
就会转卖给政府机构
或有意到当地投资的商人参考
所以对他们来说
共享自行车乱丢也是一项数据
代表那边缺乏停车或是交通动线比较拥挤混乱等等
对这些业者来说
自行车的钱少
数据卖出去的钱才是他们主要要赚的
所以他们共享自行车的租用规则其实蛮常修改的
可能上礼拜是租30分钟不用钱 这礼拜是租20分钟
这礼拜某景点排200台 下礼拜排50台等等
为的就是蒐集不同的数据
这样的大数据分析
的确和传统的统计分析不太一样
给你参考
作者: ai2311 (assa)   2017-10-18 08:57:00
五楼肛门数据专被甲甲肛
作者: fuhaho (fuhaho)   2017-10-18 08:57:00
要怎么知道借车都是游客?还有定位器说不定比车还贵
作者: bathilda (bat)   2017-10-18 08:57:00
蒐集了数据然后呢?卖到的钱会比实际做生意赚到更多?
作者: belongings (taichung)   2017-10-18 08:57:00
哪里不一样
作者: bathilda (bat)   2017-10-18 08:58:00
其实他们骗你的,他们不是为了蒐集数据,是为了骗投资
作者: qwefghiop1 (只有肥宅知道的世界2)   2017-10-18 09:06:00
用自行车换资料是有理...但我仍觉得是精神胜利法耶...
作者: meredith001 (ああああ ̄▽ ̄)   2017-10-18 09:06:00
数据这玩意数量少完全不值钱 但是多的话是等比级数在翻钱的 google就是一个案例
作者: yafx4200p (八仙果)   2017-10-18 09:07:00
现在很多都一个月免费骑~或换点数
作者: protector123 (公卿王)   2017-10-18 09:10:00
这篇值1000p台湾的ubike就没那么多数据了
作者: sam7207 (三亩)   2017-10-18 09:13:00
笑死了...算平均数 标准差 变异数分析不太一样你知道 你刚刚说的都是统计吗....只是 大数据引入了数据库管理的概念
作者: pierreqq (叶子上的风)   2017-10-18 09:15:00
那个就一般统计分析硬要挂上大数据的最佳例子
作者: sam7207 (三亩)   2017-10-18 09:16:00
喔 对了 可能我平常接触的统计 跟你也不太一样..
作者: enjoytbook (en)   2017-10-18 09:20:00
等等...人比较少?!你又不是在做实验@@

Links booklink

Contact Us: admin [ a t ] ucptt.com