Re: [请益] 关于Junior Data相关工作

楼主: h310713 (虎虎虎)   2016-09-22 22:41:50
恕删
小弟来回一下这篇好了
不免俗的介绍一下自己平庸的背景
私立统计 学士 私立统计所 硕士
大学学校教 SAS. 研究所论文写 Fortran
研究所自学 R
工作找的还算顺利 无缝接轨进入某远字辈公司资讯处 担任工程师
目前负责 公司统计模型建立 ETL程式开发 Open data 资料介接 固定统计报表产出
以及 MS SQL资料管理
废话说完了 来说正事
我个人很推荐 R
这里就不讨论Python因为我也不懂
R可以做的东西其实真的很多
举凡统计模型计算 ML 一直到我现在用R 在做 ETL 想的到的想不到的套件都有
以前R中文的教科书 我是看淡大老师 陈景祥的书 我个人是觉得不太适合新手
但是现在很多其他的书了 而且Stackoverflow 也很多稀奇古怪的问题 自学应该不是难

而且 不会被公司 限制自己 不花钱你一样可以写的很开心
只是可能是我个人Coding问题 我一直在优化效能 这就不多说了
也有人说要学SQL. 我个人在上班前完全不会SQL. 也是一边做一边学
总之 我个人蛮推荐R
对于我来说 工作上用的顺手 且不会被公司的预算限制自己
公司目前也是有买SAS. 但是我还是习惯用R 个人觉得使用上比较弹性
还没工作前我也是懂皮毛而已
直到现在才有比较懂多一些
统计模型 又或是ML 训练出来的好不好或是喂进去的资料要怎么做 Pre process 这又是
一门学问了
总结一下 学R对你的未来应该会有一定程度的帮助
我自己资历也不深
给你的经验也浅
版上很多神人可以补充
Coding 能力是一回事 统计专业也要一起培养
目前公司ETL主力工具还是C#
所以C#资料处理的步骤也有碰到
反正 Growth mindset 多碰多学多看
加油
再来补充一点事情好了
Coding 能力重要
但是解读统计数据更是一门学问
跑出来的模型怎么用
代表的参数是什么意思
Factor重要与否 这倒是需要花不少时间去培养
大数据这东西很夯
我个人还是比较喜欢统计上面的抽样
又或是把大资料变小而且又有代表性
我觉得这也是统计的另外一种价值
作者: rupcj8 (唉呀)   2016-09-22 22:56:00
不过说实在台湾公司的分工还真糟 囧不觉得你该做这么多东东@@
楼主: h310713 (虎虎虎)   2016-09-22 23:00:00
哈 我觉得多碰点 累积一下不是 坏事
作者: xsssxxzz (阿群)   2016-09-22 23:02:00
R 不错只是对GB大小的资料真的很无力...
楼主: h310713 (虎虎虎)   2016-09-22 23:05:00
所以优化效能很重要
作者: ripple0129 (perry tsai)   2016-09-23 00:49:00
R似乎不像Python有Cython Jython这类突破效能的工具?
作者: frouscy (流浪吧。)   2016-09-23 03:21:00
有Rcpp
作者: CaptainH (Cannon)   2016-09-23 09:26:00
硕士毕业还一直强调语言 唉
楼主: h310713 (虎虎虎)   2016-09-23 09:41:00
可能楼上还是用计算机再运算囉
作者: childlike12 (幼稚鬼+小孩子=娃娃ˊ~ˋ)   2016-09-23 10:15:00
所以你们作DM时都会花时间去算资讯增益这件事吗?
作者: drajan (EasoN)   2016-09-23 18:26:00
Information gain有close form solution 你是要花啥时间?
作者: swedrf0112 (M)   2016-09-23 18:54:00
对资料分析的需求 造就了好用的工具 就原po的角度而言 在强调好用的工具 作起分析更得心应手 而非比较孰优孰劣会花时间看ㄧ下 information gain 作 feature selection 还是好用的小工具XD

Links booklink

Contact Us: admin [ a t ] ucptt.com