Re: 本来学ML是该转路还是继续钻研

楼主: bowin (尽其在我)   2021-03-14 00:00:13
Quotes:“Strength is something you love doing and are good at.”
看了板上许多讨论ML vs. DS和大公司 vs. Startups的文章
(这两个面向是高度相关的) 很多都是很好的分享,例如
上一篇前同事frouscy的精辟灼见
(https://www.pttweb.cc/bbs/Soft_Job/M.1615543421.A.E10)和
之前PCMan的深入剖析
(https://www.ptt.cc/bbs/Soft_Job/M.1582728233.A.45E.html)
自己也曾在几间Startups和大公司贡献,
所以想想也来参与讨论一下、分享一点个人经验。
TL;DR:
1. 你现在拥有和未来想要有的strength是什么?
2. Data Scientist vs. ML Engineer vs. ML Researcher:
大小规模不同的公司(FAANG vs. Big Tech vs. Startups)对这些职位有不同需求。
你喜欢在大公司深入某一块做为专家?
还是在Startups做end to end资料分析、或是产品开发?
想先问原Po:
1. 你了解自己“现在”的strength是什么吗?
2. 你“未来”想要有的strength是什么?
3. 你现在与未来的strength差异有多少,你想要补上这块差异吗?
什么是strength?
我很喜欢Facebook给engineers的这句话:
“Strength is something you love doing and are good at.”
公司也鼓励你发挥、进一步强化strength.
而这三个问题是有连续性的,或许很多人无法回答第一个问题:
“你现在的strength是什么?”
其实这也无妨,我很久以前也曾思考过它,但是开始思考这个问题后,
让刚出社会工作的我逐渐站稳脚步,能安稳地累积自己和贡献所长。
下一步就是思考第二个问题:“你未来想要的stregnth是什么?”
再下一步就是深思第三个问题:
“你现在与未来的strength差异有多少,你想要补上这块差异吗?”
在试图回答这些问题过程中,我被引导回学校攻读PhD,
努力在工作中和自学Computer Science & Software Engineering,
现在还是一直很努力、辛苦地在黑暗中摸著石头前进。
每个人都有自己的想要走的路,我觉得这些路没有高下优劣之分,就只是不同的路。
而且这些路都没有所谓终点,每当你觉得自己达到了某个goal,
后面就会有另一个更高的goal等着你。
你无论如何永远不会满足。
所以重点或许应该是享受每一段从goal i → goal (i+1)的过程,
品味那些引导你方向的大小石头,享受与队友一同奋斗的酸甜苦辣。
现在回到ML。个人观点是title永远就只是title,工作内容比较重要。
Data Science自从2008年由DJ Patil & Jeff Hammerbacher提出这个词之后,
一路一来由许多不同规模的公司做出了许多不同职位定义调整,
目前未来发展的态势已经算是明朗了:
I. 以FAANG & Big Tech为例:
专精某个高度技术性工作,累积对large scale systems全面性的体认
1. Data Scientist (i.e. Data Analyst):
任务是深入进行data analysis,包含exploratory data analysis
来进一步了解某些特殊使用者或是产品面相的问题,
因为新挑战或新产品而来定义创新的metrics等等,
协助甚至是引领Product Managers & Software Engineers进行上述相关工作。
过去从事类似工作的title是Data Analyst;
在Google过去是Quantitative Analysis,现在比较多为Data Scientist,
在Facebook过去是Product Analyst,现在也比较多为Data Scientist.
2. ML Engineer:
身为一个这一生只想做machine learning工作的人,这也我目前的工作内容。
以Facebook为例,里面有许多Software Engineers的role为machine learning,
跟其他backend/frontend等都一样是拿Software Engineer的title,
只是我们的任务是ML systems/products相关高度技术性工作,
从problem definition, ML modeling, data pipelines,
feature engineering, model training,
offline evaluation, online A/B testing,
production deployment, online monitoring等等;
另有一大群ML Engineers是负责开发ML infra相关高度技术性工作:
包含data engineering infra, A/B testing infra,
online/offline feature retrieval infra, serving infra等等。
我们可以想像将ML system end-to-end切成两段:
1) ML model/system,目标就是开发能产生高价值的系统和产品,
2) ML infra,目标开发前述系统和产品所需要的底层,
能撑起planet-scale services。
在Google & Facebook上述人就是挂Software Engineer,
Software Engineer (Machine Learning),
Machine Learning Software Engineer
(在Facebook有PhD的Software Engineers蛮多人会挂Research Scientist,
在Google这点相对严谨很多,少数人才挂RS),
在其他big tech是挂Research Engineer,例如Netflix,
还有其他whatever titles.
3. ML Researcher:
普遍都是Research Scientist,绝大多数都有PhD,
任务就是研究发表最新的ML research成果。
有不少RS (谜之声:诸多公司也越来越“鼓励”)与ML Engineers合作,
将研究成果与ML systems/products结合与应用。这
类人集中密度最高的地方前几名应该就是
Google Brain, DeepMind, Facebook AI Research, among many.
II. 以大中小型Startups为例:
技能树能够较为宽广,累积对整个产品体系全面性的经验
1. Data Scientist / ML Engineer:
因为较容易吸引人才的缘故,
过去几年也普遍将Data Analyst改为Data Scientist,
公司和当事人也都期望能从事ML system end-to-end,
也真的有机会体验这整条路的滋味,
所以我们可以想像工作内容为FAANG & Big Tech里面的
Data Scientist + ML Engineer两者相加,
希望能包山包海掌握整个data analysis & ML system (与Software Engineers合作)。
但因为product/service scale相对“合理”许多,
掌握相当程度以上的AWS/GCP和open source tools就可以开发产品。
我也很感谢过去自己有这个机会在Startups学习成长了许多。
2. Data Scientist / Data Analyst / Business Intelligence Analyst:
现在似乎不少Startups也将上述titles混用,
主要负责data analysis相关工作。
个人乐观其成,因为其实不少人对于应用一些
machine learning / statistical inference挖掘资料
来进一步回答问题是很有兴趣的,这也是对公司非常有价值的工作。
IMHO未来各工作内容会更加收敛 (还是要强调无高下之分,
只是术业有专攻对个人和公司长期以来都会良性发展)
1. Software Engineer:frontend, backend, or ML
2. Data Analyst:data analysis
3. Research Scientist:research (只有大公司才有需求而且有能耐养一群PhD做研究)
至于在大公司还是Startups做DS/ML,那属于另一个问题。
回到你的问题。
Recall:“Strength is something you love doing and are good at.”
有了上面的讨论后,你对于下面的问题有近一步的想法了吗?
1. 你了解自己“现在”的strength是什么吗?
2. 你“未来”想要有的strength是什么?
3. 你现在与未来的strength差异有多少,你想要补上这块差异吗?
现在我们可以再加上几个follow up questions
1. 你现在与未来的strength是frontend, backend or ML?
2. 你现在与未来的strength比较适合在Startups贡献还是在大公司发挥呢?
若能回答上述多个问题,希望你就能对下一步有个概略的想法和目标了。
最后再强调一下,工作内容无高下之分,术业有专攻,
重要的是相同职位和不同职位的所有人们都能相互合作。
然后不同大小规模的公司都有我们需要学习和可以贡献的地方,无绝对利弊,
任何公司和职位都有辛苦的一面,
绝对没有所谓“啊我达到这个目标了,可以从此过著幸福快乐的生活”这种事,
因此我们的重点或许应该是:享受每一段的过程。 :)
※ 引述《ckrmpuhv (阿瓜)》之铭言:
: 各位板上大大好
: 小弟是后段国立科大资管硕即将毕业
: 因为一些私人原因是不用当兵
: 所以论文完成后准备开始找工作
: 目前程度:
: 大学学过JAVA
: 网页跟数据库也只有课堂学习过没实际做小专案
: 因为对Ml有兴趣
: 在硕阶段期间 都是自学ML相关
: 听过李宏毅老师的课
: 实作过他课程的作业
: Keras的一些神经网络搭建也没舍问题
: Kaggle只参加过一两次 排名都很烂
: 大部分的实作和论文都是跟影像辨识相关
: 最近看板上大大各式各样建议
: 非四大四中 也不是kaggle的佼佼者
: 数学方面 线代没学 统计学大学学过但也不熟
: 看完觉得自己很烂出去可能没人要?
: 目前都还在做ml各种模型实作
: 但看完板上很迷茫要往哪些方向学习怕找不到工作非常忧郁
: 我不清楚该横向发展拓别的领域
: 像是网页、App 自己做一些小专案增加作品集
: 还是去补数学 更深入研究Ml
: 又或者先去刷Leetcode打底
: 还请各位大大指教 谢谢
:
作者: Apache (阿帕契)   2021-03-14 00:03:00
这篇英文真的有点多了 你要不要全打英文比较好机翻
楼主: bowin (尽其在我)   2021-03-14 00:08:00
哈哈不好意思请见谅,专有名词有时觉得很难英翻中
作者: IcecreamHsu (冰淇淋)   2021-03-14 00:12:00
推 是说目标和过程那段也是我最近在思考的
作者: longlyeagle (长鹰宝宝实验室)   2021-03-14 00:12:00
大公司不同部门的Data Scientist定义也可能完全不同
楼主: bowin (尽其在我)   2021-03-14 00:40:00
其实若StitchFix也算大公司的话,他们的DS也是负责modeling但是这样的DS配置以大公司来说有越来愈少的趋势
作者: LordCHTsai (我饿了)   2021-03-14 03:14:00
G也是有挂research engineer的
楼主: bowin (尽其在我)   2021-03-14 03:33:00
是,看过的大多在Google Brain.不确定product teams有没有
作者: branie (Branie)   2021-03-14 03:35:00
晶晶体?
作者: Dartmoor (纵谷的春天)   2021-03-14 03:56:00
感谢分享
作者: LordCHTsai (我饿了)   2021-03-14 04:03:00
看阁下的IP莫非是DM的?
楼主: bowin (尽其在我)   2021-03-14 04:45:00
请branie见谅
作者: drajan (EasoN)   2021-03-14 07:21:00
好文啊
作者: testPtt (测试)   2021-03-14 08:47:00
出来工作结果老板要你用ml写一支算命程式
作者: nubao123 (酷帅小小熊)   2021-03-14 09:55:00
推!
作者: landysh (蓝色窗帘)   2021-03-14 09:59:00
好文推
作者: frouscy (流浪吧。)   2021-03-14 10:53:00
推强者bowin大大
作者: kevinfilter (justinyeh1995)   2021-03-14 12:14:00
推~很清楚的描述
作者: Wush978 (拒看低质媒体)   2021-03-14 14:45:00
作者: AmosYang (泛用人型编码器)   2021-03-14 20:47:00
推“过程”的观点
作者: tokei (KeepTheFaith)   2021-03-14 23:13:00
好文推
作者: fig498 (一起前进!)   2021-03-15 00:09:00
大推,非常感谢B大分享
作者: aphiya   2021-03-15 08:25:00
nice
作者: Kocolook   2021-03-15 09:59:00
推!
作者: Ouranos (å—¨)   2021-03-15 17:32:00
大推!
作者: answerseeker (神灯)   2021-03-18 12:38:00
大推这篇 基本阐述湾区现况 敝公司DS80%+ PhD也做modeling
作者: meRscliche (如此而已)   2021-03-18 23:52:00
优文推,感谢
楼主: bowin (尽其在我)   2021-03-19 08:32:00
谢谢大家!有些人写信来问ML职涯,可惜暂无法逐一回信讨论
作者: jt851113 (Mocking)   2021-03-23 16:50:00
推好文 感谢
作者: bearsteak (熊排)   2021-04-01 05:14:00
推好文

Links booklink

Contact Us: admin [ a t ] ucptt.com