[问题]Hadoop能干啥?

楼主: sealoe (不买美债=人权倒退XD)   2014-08-27 16:05:48
说到hadoop 以广告来说 就是大数据分析
而最著名的例子就是尿布和啤酒
我对于尿布和啤酒的例子有疑问
当然 找到两个相关的产品 互做广告有增加销售的效果
但是 首先 我有2个问题
1. 首先 我要花多少钱 建制哪些东西 才可以得到这类型结论?
2. 我在得知这结论之前 我要怎么知道我要这个结论?
而除了搜寻引擎(基本上搞论文才有价值)
hadoop在一般应用上 能做啥 找尿布和啤酒这类型相关的题目?
而这种题目 而我得到这结论又能干啥事? 我为何要花这么大的功夫去得到这结论?
我说个情境好了
当我得到尿布和啤酒相关的结论
"我可能在啤酒那做尿布广告吗?"
根据尿布和啤酒的结论 事实上 当然也可以得到
尿布和纸杯
尿布和花生
啤酒和花生
啤酒和小鱼干
啤酒和纸牌
花生和烤肉
烤肉和烤肉酱
卫生纸和烤肉酱
沙茶酱和火锅料
这类型的常识性结论 问题是
我可能做相关的广告吗? 这样 我啤酒那要贴多少传单?
就算我得到这类型的结论 实务上的应用又在哪里?
这类型的销售结论 不用透过大资料应用
实际上你随便想想都有常识性的结论
以此例而言
为啥我要特别为尿布和啤酒打广告? 而不会常识性的结论打广告?
当然 这个问题和hadoop的架设以及资讯的价值 没有很大的关系
只是 实务上 到底能用来干"什么" 又这个"什么" 能带来哪些价值?
作者: timfan3939 (K61+417)   2014-08-27 16:43:00
尿布和啤酒,并不是用hadoop找到的以往的资料分析,是要下载资料后才分析但hadoop改变了这架构,程式上传至储存的地方分析最后再统计结果你举的尿布与啤酒,似乎只是特解示一个特殊的现象就是买尿布的人,会顺带一打啤酒(因为是男人在买的)实际应用应该是将啤酒广告或商品,放在附近不一定是隔壁,达到方便客人的角度或是将两者放得很远,为了取得两样商品,客人将走过全卖场,反而有可助于提升业绩(可能会心动多买东西)多少钱→就硬盘大小,每笔交易记录如何存下如何知此相关→有目的找也是可以,没目的找也可。本例子重于说用资料采矿技术,发现法奇怪的结果。而如何正确解示此结果才是重点至于hadoop 只是用些技术,将“发现”这个结果的过程“加快”而已。要如何去找到你要的东西,还是依赖演算去达成不知以上有没解答到您的问题?
楼主: sealoe (不买美债=人权倒退XD)   2014-08-28 10:20:00
thx 我再想想看~我大概理解了 事实上我该朝向资料探勘去看而不是被广告词导向 而使用实际上不见得实用的工具thx
作者: timfan3939 (K61+417)   2014-08-28 19:37:00
有时挖这个东西不一定是广告,行销不是只有广告一途如何使用此结果来赚更多钱,对商人来说才是重要的所以别被框架框住了
作者: felaray (傲娇鱼)   2014-08-28 22:08:00
其实我觉得那就是资料探勘,Hadoop只是简化分析的工具。T大其实可以回篇文章了XDhttp://ppt.cc/a2xt 别人做的 记得是用实价交易去分析房事交易的种类
作者: kevingyc (居歪西)   2014-08-29 07:46:00
啤酒跟尿布,只是资料分析过后的观察,不是一开始的假设
楼主: sealoe (不买美债=人权倒退XD)   2014-08-29 15:14:00
事实上 我稍微看了一下 这类的系统 都要非常大才有价值举个例子 对沃尔玛的商品销售资料做资料探勘 举例奶粉尿布或许可能利用到 但是对于传统的店家 甚至于大润发似乎不太需要.(以找出最相关的两件商品这种事上为例)不过 我大概有点了解 要搞懂这方面的知识 似乎不是一天两天可以搞定. 且销售资料也得累积. 举例来说 我如果要用就是要 1.先找人设计或是找到工具 2.根据工具特性输入资料做成资料仓储的东西 3.经过一年后, 开始可以做些相关产品的销售调查(资料探勘) 这样 真的合成本吗? 之前的系统是得全部换掉? 假设以10间超商就好了, 换掉POS换掉销售数据库, 不用太多, 上百万还是要的. 这样要做啥才能真正让引入类似技术有价值呢? 还是说 这类技术是设计给沃尔玛类型的大公司使用, 如果规模不够 实际上不该使用呢?
作者: felaray (傲娇鱼)   2014-08-29 19:36:00
样本数要够大 价值比较能显现出来 因为在巨量资料的情况下用传统人力已经无力去分析..
作者: timfan3939 (K61+417)   2014-08-30 14:25:00
样本数不够大还是可以分析。只是分析出来的结果会有些噪声,会导致误判之类的。至于pos之类的,大多都有收据系统,就是买完后就给张收据,这也是未来公司对帐的资讯。若旧有pos好用的话,不如只增加存资料的功能也就是收据记录功能就好了。资料方面,不是有需要才记录,而是平时就在记录,需要时才能快速取得,快速送去运算,得到结果说真的,如果公司没计画去记录下所有可能的数据,那就用普通的市场调查就可以解决了。而大数据也算是市场调查的一部份,准确度比去一个一个问还准(资料多,且全部的资料都算),且较方便(用几台电脑就跑出来了,不用花心思设计问卷、吸引别人来填之类的)

Links booklink

Contact Us: admin [ a t ] ucptt.com