Re: [请益] 转行做资料数据分析

楼主: loveu8 (RA1-推广)   2017-09-08 07:53:08
前文砍~
作者: f496328mm (为什么会流泪)   2017-09-08 07:56:00
针对第二点,即使有遗失值,尽量还是不要删除该笔data如果未来会做到ML,ML是可以处理遗失值的
作者: a3236852 (serena)   2017-09-08 08:37:00
对我很有帮助 谢谢你~
楼主: loveu8 (RA1-推广)   2017-09-08 08:39:00
哦哦,原来是这样,ML介入的话可以处理这块还在想说,这些资料应该还是有用途的,应该还是有方式可以让这些资料发挥作用,来源是这样!哈。感谢~~
作者: askia (过客)   2017-09-08 09:32:00
你说的1&2是资料分析最重要的部份不过视觉化应该是在分析资料以后才做的事吧
作者: f496328mm (为什么会流泪)   2017-09-08 09:36:00
极端值也要看看,到底是错误,还是该顾客是VIP等级,消费能力高如果data是关于网络购物,那社会科学有一种叫,RFM model,可以参考看看
作者: sennacon (故乡可以"正名"吗)   2017-09-08 10:16:00
怎么觉得是我的前公司XD
作者: Ekmund (是一只小叔)   2017-09-08 11:06:00
可以让员工这样玩 真是好公司QQ
作者: firingmoon (小天)   2017-09-08 11:17:00
大学以前就在玩这个,出社会那么久很想再回去玩
作者: y800122155 (@__@)   2017-09-08 12:43:00
这几步骤就是单纯做叙述统计啊 用ML之前 先简单分析看一看资料长怎样是很基本的事情 后面还有很多可以分析
作者: IhateOGC (我讨厌)   2017-09-08 12:47:00
资料分析精髓就是整理资料套公式和决策真的是老板的事
作者: vfgce (小兵)   2017-09-08 14:22:00
缺漏值不多时,可以选择删除或填补...但比例太高时,就要小心填补了太多"假资料",对于之后的应用可能会造成影响....
楼主: loveu8 (RA1-推广)   2017-09-08 15:23:00
to f496328mm 学到东西了,哈,回家来看看to y800122155 , 是啊,很简单的分析,以前从没接触过觉得还蛮有趣的,只是后面还是有原本东西要用,就放著了剩下就交给公司内专职的资料分析师,处理后续了~to vfgce , 还好经手的资料,还没到这个程度,倒是有其他人遇到过,只好想办法处理了,哈to askia , 是啊 , 只是有时候我们工程师没有决策能力又无法有效说明的时候,视觉化存在是加强你前面1跟2的注释一样,加强拥有决策的人,信任你做出的资料~ (无奈XD)
作者: f496328mm (为什么会流泪)   2017-09-08 15:42:00
ML处理遗失值,除了填补,还有一种是利用决策树的概念,去进行预测
作者: askia (过客)   2017-09-08 16:06:00
to loveu8: 但是这个文章的标题是“分析”啊
作者: subset (子集合)   2017-09-08 16:50:00
视觉化在超过三维度的资料应该很难做到吧若是在N维的资料中 取出1~3维资料 又会看不到隐含的东西
作者: f496328mm (为什么会流泪)   2017-09-08 17:20:00
ㄜ....,视觉化不是指画画二维图三维图
作者: subset (子集合)   2017-09-08 17:56:00
愿听楼上指导
作者: ray39620 (Level up)   2017-09-08 18:27:00
视觉化可以很丰富喔,多维资料也可透过各种方式去呈现观如连结,http://www.datavizcatalogue.com/
作者: f496328mm (为什么会流泪)   2017-09-08 18:58:00
推楼上,另外 https://goo.gl/yu9c38连结中的图,我觉得也很不错
作者: vfgce (小兵)   2017-09-08 19:18:00
决策树,KNN或是均值,都是补值,缺漏项一多,模型可信度就要再考虑一下...视觉化要小心处理,一堆初学者都以为决策平面一定画得出来..
作者: y800122155 (@__@)   2017-09-08 21:39:00
missing value handling方法很多 每个case适用的处理方式不一定一样 常常是需要做叙述统计去看一看状况有时候看用的Algo不同 有的不补值可能结果还比较好
楼主: loveu8 (RA1-推广)   2017-09-09 07:33:00
感谢各位回馈,果然要一群人讨论,进步最快阿~RFM 我有喵了一下,可惜没有完全实作主要是商品与捞取的会员资料范围区间才一年半还真的无法看出有效的回购时间,只好做出一张简单的消费次数与金额级距表,解释我们会员的消费能力不过等有机会在玩了(专案烧屁股中XD

Links booklink

Contact Us: admin [ a t ] ucptt.com