[请益] 如何踏入Data Mining/Engineers领域

楼主: robin112 (Robin)   2014-07-23 15:53:44
小弟四中统计研究所应届毕业,
论文内容主要讨论logitudinal data的clustering,
会想踏入这个领域主要还是因为发现自己对于资料分析还是乐在其中XD
基本统计工具都还算可以(regression,GLM,multivariate analysis),
求学阶段也有使用过这些工具分析过一些小的raw data。
主要的语言工具为R(loop,array,function etc.)
可以将大部份知道逻辑或步骤的统计方法写出来,
C++有摸过但不熟悉,目前正在跟着codecademy学Python,
目的是想作一些蜘蛛抓data下来,再进行后续分析来玩。
这一个多月在网络上投了不少Data Mining相关的履历,
有的职缺感觉条件蛮相符的却像石沉大海一般,
有些说可以培训或接受新鲜人也没有回应,
或是觉得我有潜力但还是不符要求。
看着身边不少同学都已经找到好工作了自己也开始紧张,
爬文也了解自己的弱势在于如何从数据库中抓data(ex:SQL),
以及现在流行的Hadoop及MapReduce等big data的技术,
但我疑惑的是,对业界而言是否不会这些技术就无法踏入?
因此想来请各位给我一点建议,谢谢!
作者: kangta0819 (崭新)   2014-07-23 16:06:00
何不从身边同学的工作跟产业着手呢?
楼主: robin112 (Robin)   2014-07-23 16:36:00
身边同学大多进入品管或生物统计产业 没人走这方面XDD
作者: circle666 (虫宅虫宅)   2014-07-23 16:36:00
感觉上资工机会比统计大得多
作者: lovdkkkk (dk)   2014-07-23 16:48:00
可以考虑考个资工博, 有学生身份可以投雅虎的 intern实习比较容易进去, 再学怎么用工具实习完博要不要唸完就再说 (不过资格考可能的话就拼一下)然后你 "目前是想..." 那段, 建议开个 github 帐号放中间有什么学到的觉得值得记录的, 找个 blog 记下来整理得有条理一些, 将来可能会有帮助话说回来, 实习也不一定会上, 但最少可以修些课资结程设算法跟资料探勘修好一点, 应征时可以秀成绩单总之起码有些可看见的实绩是最重要的另外也可以考虑新创/小公司的 Data Analyste.g. http://ppt.cc/6w4G (纯举例)虽非 big data, 但可先工作边补足经历/能力 (如 SQL)
作者: DrTech (竹科管理处网军研发人员)   2014-07-23 17:34:00
来这个版问,你只会得到一种答案,去学程式语言你说你投了很多履历,该不会都是程式缺吧。建议往BI、ETL、SPSS、资料分析、等关键字找,比较适合你
作者: chester06 (chester)   2014-07-23 21:13:00
程设是可以学的, 你的统计学知识反而才是关键
作者: berton1679 (低调boy)   2014-07-23 21:47:00
听DrTech 资工博last resort别千万只为这理由 念博..
作者: blueprecious (小无尾熊)   2014-07-23 22:04:00
我觉得你如果是对"资料分析"有兴趣的话,应该先去找你有兴趣的资料,资料分析的重点在知道要抓哪些资及能够解释分析的成果,程式只是种分析工具
作者: francej (~~~~)   2014-07-23 22:09:00
我想问题是出在这个领域僧多粥少吧. 资工资管数学统计工工甚至连社会经济背景的都有在搞DM. 你算一下四大这些科系每年毕业多少人,就不难理解为何会石沉大海了建议要不去洗个学历 阿不然就只好认命有找到工作就好累积点职场经验值,然后再跳槽自己理想中的公司职缺还有金融,生物资讯科系也有在搞DM..多数人士校名优先..so.
作者: blueprecious (小无尾熊)   2014-07-23 22:20:00
我可以说一下DM跟统计其实有很大的不同吗XD这个职缺很需要对某个个产业有一定的熟悉程度,这样你才知道要抓什么资料及如何解释分析成果所以建议先找到你有兴趣的产业工作后再往这边走^^
作者: lovdkkkk (dk)   2014-07-23 22:30:00
唸博只是手段啦, 随时可以肆业...XD各领域都搞这个很正常 (指分析), 像生物学上也有用到大家都想靠个什么神兵利器把一眼看不出的资讯抓出来...XD
作者: MOONY135 (谈无欲)   2014-07-23 22:37:00
三月丢到七月面试五家这种缺 应该还好吧 我是私硕
作者: johnny94 (32767)   2014-07-23 23:52:00
http://ppt.cc/zeXf 统计版这篇文章给你参考看看
作者: sleepwu ( )   2014-07-24 00:17:00
要有真实的raw data
作者: aacs0130 (湛靈)   2014-07-24 14:32:00
http://ppt .cc/3j9n road to a data scientist.http://ppt.cc/3j9n 看完就知道自己该补什么了
作者: lovdkkkk (dk)   2014-07-24 15:54:00
好像哪里的捷运路线图...XD
作者: DrTech (竹科管理处网军研发人员)   2014-07-24 18:57:00
那篇文章很多过时的观念,例如Excel无法处理Big Data。对Open Source的工具理解也是五年前的状态。至于捷运图就参考就好,图中很多Bug。例如想不到为什么学完Hadoop安装后,还建议去学 MongoDB,完全没逻辑。晚点有空再回我的看法。
作者: com183 (com183)   2014-07-26 11:27:00
科技业版,发哥刚好在征@@

Links booklink

Contact Us: admin [ a t ] ucptt.com