Re: [请益]资料分析/科学的工作是不是几乎都要硕士..

楼主: applehpsh   2018-02-09 00:54:35
※ 引述《HWSH (光的夜生活)》之铭言:
: 小弟去年从国立台北大学统计系毕业
: 计画先工作个两三年再去申请国外研究所
: 目前即将服完兵役 本来是希望年后可以开始上班
: 最近几天开始找工作 履历却一直被已读
: 感到一点小小的“挫折”
: 看了一下应征者状况 六七成都是硕博
: 唉学历拼不过别人真的是硬伤
: 真的没有一些初阶的资料科学家助理工作可以做做看嘛哈哈
: 我很乐意从Data Cleansing的工作做起
: 交代一下背景
: 大概是大三决定要走资料科学家这条路
: 接触coding到现在大概两年
: 最常用的是R跟SAS
: 有去修资工的资结跟算法
: 会一点C跟Matlab
: 最近在看线上课程学python
: 英文听说读写没问题
: SQL还真的完全没碰过(满多职缺都有要求)
: Deep learning几乎没有头绪(只知道ML)
: Hadoop跟Spark只知道是在干嘛的也没有实际操作过
: 唉唉真的是太嫩了
: 想请版上的前辈大大们点一盏明灯提供一点建议
: 谢谢谢谢 用力鞭没关系
身为这一块的弱弱从业人员给你建议
我觉得你心态可能要改
资料科学家 70%以上的时间都在做data cleansing
但你好像搞错状况了 以为这种东西是初阶的工作
但是实际上并不是这样 实战经验上需要想办法增进把资料清整时间到可以拿去建模
在台湾 有意愿想做这方面的公司在过去对于资料的管理上都很不严谨
你看到的会是杂乱无章又一堆莫名其妙的资料
光是处理资料encoding的问题就够你烧脑烧时间的 更别说还有一堆杂事
如果你以为资料科学家只要爽爽地建模就好了那真的是太天真了
加上从你内文中没接触过SQL 没玩过Deep learning 好像也不会爬虫
资料视觉化的工具也没提到会不会
ML到底接触多深也不知道 要走资料这块只会R却不会python 也是硬伤
劝你先去了解一下R和Python彼此的优缺点
另外有没有实际上玩过什么专案也看不出来
讲白了如果我部门开缺你来应征 我还真不知道有什么诱因让你进来一同工作
有个建议是如果真的想增进实力
上去Kaggle看看其他人在干嘛 同样的dataset你能不能做出跟人家一样的结果
或是去挑个竞赛区的试试看自己做出来的结果到哪
另外就是最近吹很大的各种相关“前景”请审慎看待不要一头热
有时候实务面上跟这些投机客炒作的泡泡还是有不小的落差
作者: wilson85771 (HOW)   2018-02-09 01:56:00
推这篇
作者: jerry771210 (说在多也没用)   2018-02-09 02:13:00
推推
作者: TAKADO (朕没给的你不能抢)   2018-02-09 02:54:00
10-15年前,大家都在跟风玩data warehousing 炒作data mining种下的恶果啊,看过一堆奇葩系统各种没建pk fk constrains,没有正规化,各种垃圾资料狂塞猛送,然后现在抱着这些资料要来玩AI。
作者: laba5566 (最爱56家族 啾咪)   2018-02-09 08:52:00
嘴砲>>>>>>>狗屁ML+资料分析 不会嘴走这行是找死
作者: testPtt (测试)   2018-02-09 09:40:00
nosql就是让你这样玩阿
作者: lichai (雷迪咖)   2018-02-09 09:43:00
正解…
作者: Abhoth   2018-02-09 11:29:00
楼上TA大的回复深有同感QQ
作者: drajan (EasoN)   2018-02-09 14:32:00
你真的懂data warehouse吗?:) 正规化是要看场合来使用的
作者: askia (过客)   2018-02-09 19:26:00
推,一看就知道是内行。学术界老是讲一堆xxx方法、模型但是真正的实务只有三个要点:清资料、清资料还是清资料有干净的资料一切都好谈,否则什么都是屁。GIGO
作者: MOONY135 (谈无欲)   2018-02-09 20:14:00
哈哈哈清洁工
作者: lovdkkkk (dk)   2018-02-09 21:01:00
扫地僧4ni
作者: vfgce (小兵)   2018-02-10 16:23:00
资料分析用'数据库正规化'会很想死吧......至于清资料也不用讲得多神奇,主要是你对这个资料的了解...知道怎么用,那些有用,那些噪声....资料分析常常是一个资料表拿来用,'正规化'反而造成麻烦...
作者: TAKADO (朕没给的你不能抢)   2018-02-10 16:46:00
楼上几楼说的没错 DW根本没有正规化的问题但是在那个大家都在玩DW的年代一堆公司DB都刚起步然后看是凹MIS去学或找便宜工作室帮忙弄然后就出现了因为OLTP->DW时 ETL乱写进不去但是DW是顾问开的 然后只好operational DB做去正规化到1NF或是把DB跟DW混在一起做撒尿牛丸 设计成star-schema这样就没有转资料的问题了,大家都开心如果资料是靠爬虫或是open data去捞还好如果是抱着整个数据库来的挺多雷 里面各种世界奇观都有
作者: shiauji (消極)   2018-02-11 10:18:00
推楼上大大跟这篇
作者: sailoruranu   2018-02-11 14:01:00
推 我之前做report也都一直在整理资料 老是有莫名奇妙的资料会被放进db

Links booklink

Contact Us: admin [ a t ] ucptt.com