[心得] 2021海内外数据科学、资料分析求职心得

楼主: ncku55667788 (老邱)   2021-11-15 16:17:50
(代po) How I passed 26 interviews & got 6 DA/DS offer from Disney+, Bytedance, SeaMoney, LINE TV, DiDi, Kuaishou
Medium好读版(附有资源连结):https://bertmclee.medium.com/2021海内外数据科学-资料分析求职全攻略-壹-成绩单-攻略-资源-c36b0138b86b
在入职北京Disney+ Hotstar的第一个周末,我希望将过去几年的职涯摸索过程纪录下来。这一路走来的不甘心,也许暂时告一个段落了。希望透过这一系列的文章,给同样想走Data这条路的人一点帮助,就像我一直以来受到这个大社群帮助一样。
此篇是求职全攻略系列文中的精华,从上海黄浦江写到北京中关村,可谓倾尽全力、呕心沥血。
本文会从求职计画源起、求职成果、准备攻略@直写到资源汇总,希望能帮助到同样要经历海内外DA(Data Analyst)/DS(Data Scientist)求职的朋友。
Outline
* 求职计画源起
* 2021 求职成绩单
* DA/DS求职要做哪些准备?
* 对于DS各个科目,我如何做前期准备?
* 前期准备之后,如何得到大量的面试?
* 开始大量面试后,如何准备?
* 其他求职相关Q&A
* DA/DS求职准备相关资源分享
求职计画源起
2020年11月,我花了很多时间将一亩三分地和Medium上的DA/DS求职心得总结在Notion上,写成“DS找工葵花宝典”。我一直在跟我在数据之路的好兄弟Ryan说,依我过去在教会所受到的训练,我可以自修几个月考上台大,指考物理93,化学88,英文91.5,托福104,GRE 327...其实准备面试跟考试的道理应该是差不多的,让我全力准备几个月,依我的计画力跟执行力,没道理失败。其实原话是:“让我全力詹两个月,没理由输。”
*注:NBA球星LeBron James在生死战时,会开启[全力詹]模式,平常则是经常[滑水]、[散步]。
在那之后,我在DBS接到一个比较大的Project,一直到2021年4月中,我在DBS的工作都比较紧凑、充实,也比较没有花太多心思在求职上。
因此,确实参考“DS找工葵花宝典”拟定自己的“2021海外找工准备计画Pro Max”是从2021年四月底开始。
在此之前有一则重要的LinkedIn讯息让我对这个计画更有信心:2021年3月19号,在旧金山Twitter的Janet学姊介绍在新加坡Twitter的MLE (Machine Learning Engineer)机会给我,尽管最后五月面试没有上,但这让我知道:原来我离我的Dream Job也许并不是那么远。
好,前面铺成了这么久,差不多是时候上干货了。
2021 求职成绩单
https://imgur.com/TzEGFbS.jpg
海投29个,内推19个,共投48个,被动受联系8个,总共接触了56个职缺,正式进入招聘流程的有15个。
总共做了1份简报、1个Take-home作业、3个OA (Online Assessment)、32场面试,通过26场,拿到6个Offer,3个北京、1个台北、2个新加坡。
https://imgur.com/LpeVPBh.jpg
6个Offer,1个BA、3个DA、2个DS。
那接下来的问题就是:
How did I make it ?
我想分为几个部分,首先最大的题目是:
DA/DS求职要做哪些准备?
DA/DS 求职准备清单
**: 热门必考
(1) Programming:
- Python **
- Pandas **
- SQL **
- Bash, Shell
(2) Foundation of Mathematics:
- Statistics **
- Probabilities **
- Time Series
(3) Machine Learning:
- Machine Learning **
- Deep Learning
- NLP
- CV
- RecSys
- ML Design
(4) Data Engineering & Big Data:
- Airflow
- Hadoop
- Spark
(5) Product & Case:
- Product **
- Case **
- Estimation
- A/B Testing **
(6) Take-Home Challenge:
- DS Take-Home Challenge
(7) Data Visualization
- Tableau
- Power BI
- Python DataViz Packages
(8) Behavioral Questions
- BQ **
为什么会有这么多要准备的科目?
数据相关职缺在每间公司,每个部门的定位都不一样,同样职称是DS,做的事情可能大不相同,有的偏重分析、推论,有的偏重Modeling,有的偏重A/B Testing,有的可能一条龙从Data Engineering, ETL到Data Visualization、Dashboard都要做。因此面试的内容变化也比较多,可以从JD(职缺描述)和面试中了解到这个职缺注重哪些特点跟技能。
我需要准备这么多技能吗?时间有限怎么办?
这个就是目标和策略的问题。如果有很明确、具体的求职方向,你当然能够将准备的范围限缩,针对重点科目做准备。但对我而言,我认为以长远来看这些都是累积的过程,我还不希望侷限自己,不论未来要成为CDO数据长、Own一个Product or Business,多一些技能跟经验总是好的。因此我这次BA, DA, DS, MLE, NLP Engineer都有准备和面试。
考虑成功率的话,其实重点不在于要不要面试多种职缺,而是对于每种职缺的准备经验都要有所累积,最好是密集、大量的准备、大量的面试,practice makes perfect。面试状态对于面试表现的影响不亚于实力。
我还是不想准备的这么杂怎么办?
你可以放弃做Data,去面Software Engineer吧,刷题就好了。
我开玩笑的。当然以一个Junior求职的状况,准备Software Engineer面试也许会比较单纯,在不考System Design的情况下,国际大厂通常就是以Leetcode形式的Coding题为主,但这完全不代表比较容易,在大CS时代之下,竞争也是非常激烈的,人人刷满300题、 500题,甚至破千的神人也不少。这是自己可以考虑的。
对于DS各个科目,我如何做前期准备?
我直接分享我在2020年11月就写好,2021年4月开始执行的“2021找工To Do List”吧:
SQL
https://imgur.com/PYGlr4I.jpg
Python
https://imgur.com/H4iHwgO.jpg
Product & Case
https://imgur.com/1UAgKII.jpg
Statistics & Probabilities & A/B Testing
https://imgur.com/V0dfIx5.jpg
Machine Learning
https://imgur.com/8ALNWQp.jpg
Take-Home Challenge
https://imgur.com/es3S562.jpg
Behavioral Questions, Tableau, Hadoop & Spark, Linux & Bashing, English
https://imgur.com/4oDwWbm.jpg
并将这些To Do,安排到前期准备的6个Phase中:
https://imgur.com/7R5Cy9C.jpg
DS求职前期准备6个Phase,数字为预估准备天数,扣除作为预习的Phase 0和锦上添花的Phase V,总共应花51天。
前期准备我预估要花51天,就是将近两个月的时间,实际执行上,虽然还有不少调整跟不可控的意外变动,但误差不大。
这边可能有个问题是:
我应该准备到什么程度,才开始面试?
这个问题没有人说得准,很多人会说:“永远没有准备好的一天”,因此建议你一边投履历、面试,一边准备,毕竟面试结果很难说,说不定一下就上了。
我的想法是,对于那些难得、不容错过的机会,当然要试试看,比如说一年一度的校招申请截止日,你当然不能错过。但是除此以外,我会觉得清楚照着自己的步调跟计画走也很重要。你不会希望连基本的准备都没做好,然后面试表现不好、场面尴尬,这样相当伤士气跟信心,并且反而换来公司冷冻期半年或一年。
前期准备之后,如何得到大量的面试?
简单总结这个题目:
* 一份包装漂亮的履历。
* 找内推、Refer。
那延伸的问题是:
怎么写好履历?
这个题目我先分享我自己的经验:
* 我在大四上的时候,听过一堂Mason免费办给学员的履历课,开始使用LaTex来编写履历。Mason现在有针对求职专门开课,看在Mason帮过我的份上帮他工商一下。
* 我在台大修过一门江介维老师教的“深造预备英文写作”,针对履历、Cover Letter、自传、SOP相关的书写都有帮助。
* 请别人帮你看履历。
* 最后就是参考其他人的履历。
更多细节就是付费内容了XD。
怎么找人内推、Refer?
* 平时经营好自己的LinkedIn、Medium:新加坡Twitter的机会,就是台大学姊在LinkedIn关注到我,主动帮我内推的。另外像是Binance, Garena, McKinsey, 新加坡SeaMoney的机会都是HR或Hunter在LinkedIn主动介绍给我的。
* 找学长姐、前辈、朋友们:我很幸运有认识在各国Facebook、Amazon、Google漱H,有些职缺可以跨国内推,有些有限制,可以请朋友看看。
* 关注Facebook、Medium、PTT、LinkedIn等社群:很多朋友有分享工作或面试经验并协助内推,比如说新加坡TikTok的Junlin前辈、新加坡Shopee、SEA、泰国Agoda也都有一些朋友经常分享。
* 一亩三分地:我有很多内推是在上面找的,包含Disney+、快手、蚂蚁金服、小红书、拼多多...都是在上面请人内推的。包含亚太、美国的机会都有,当然美国的前提是要有签证。
* LinkedIn Cold Message:新加坡Ninja Van、GBD、台北Line TV就是我在LinkedIn上发Cold Message得到内推的,但整体来说,成功率不是很高。
* 半路出家软件工程师在硅谷:这个部落格也可以参考。
开始大量面试后,如何准备?
Step 0: 熟悉自己的履历。
这个是最基本、最重要、面试中准备CP值最高、最常被问到的。有几个准备的层面:
* 清楚自己做过什么事,可以完整的用STAR框架介绍(通常Action, Result占比会高一些)。
* 知道如何在不说谎的前提下,隐恶扬善的包装。
* 思考可能会遇到的follow-up question,如何应答。
要多清楚自己的履历?以一个做模型的DS来说,基本上对于写在履历上的每一个模型都要很熟悉,举例来说我有用过BERT这个模型,那我至少要熟悉:①模型架构每一层的细节 ②模型预训练的方法 ③模型常用的下游场景和用法 ④我是怎么用的;甚至包括:⑤模型训练的参数挑选 ⑥与其他相关模型的比较、选择 ⑦可能改进的方向。基本上这些都有机会被问到,这时候你就要把自己想成李宏毅or林轩田。
这里只是以做模型为例,对于其他项目、Project也是一样的道理。
Step 1: 清楚职缺内容、面试内容
详读JD,了解该职位重视哪些特质和技能,并勇敢而有礼貌的跟HR确认面试流程、内容、面试官资讯,尽管他们可能也无法透露太多,但是在面试前多一分资讯都是很宝贵的。
Step 2: 研究面试官背景
如果有面试官的姓名,我会到LinkedIn看看面试官的背景,说不定还能找到他的Medium、GitHub、Kaggle、Facebook、Twitter A难说面试聊天的时候会不会用上,但至少你知道你是跟什么样背景的人说话,揣摩要用什么角度来表达。
Step 3: 找面经、面试心得
中国在这个部分的资源相当丰富,一亩三分地、牛客网、看准网上的面试经验分享很多,Google关键字这些互联网大厂跟职缺的关键字通常都找得到不少。
新加坡的话比较难找,一亩三分地、PTT、Medium上有少部分的分享,Glassdoor上会更多,但是深度通常比较浅。
台湾的话,我有用面试趣、或著也是看PTT、Medium上有没有人分享。
我会先将相关的面经都搜集起来,再按照题型进行分类。
Step 4: 针对公司、部门业务做研究
至少对公司、所属产业状况、发展趋势有一定的了解。我看了不少“人人都是产品经理”的文章,有一些竞品分析、赛道分析、指标分析。特别记得包括快手跟抖音的短视频行业、滴滴旗下橙心优选的社区团购竞赛、Disney+, Line TV的流媒体产业、SeaMoney的FinTech事业。
这些对于面试中后阶段,Product跟Case的分析问题,指标拆解问题,都有很大的帮助。
有些人说这就是BA/DA面试的决胜点,也是没有行业经验的人难以跨进来的原因。不过我就是从银行业进到互联网产业的,所以我想不是没有机会,就是保持学习跟关注吧。
Step 5: 针对面经中的各种题型练习
如果有考算法Coding的话,可以买Leetcode Preminum,刷该公司的题目,我印象中字节的面试中有一题是公司高频原题。然后面经里面的题目也可以刷一遍。
其他部分一样针对各个题型做练习、准备,找资料。我没有找人做Mock Interview,就是自己模拟,或是自己讲讲看题目,练习如何Structural的回答问题;或是模型推导,就自己把模型结构画出来,数学公式推导一次。
Step 6: 客制化自我介绍
通常面试还是会以自我介绍开头,所以为开场准备一个吸引人的自我介绍还是必要的。我有稍微在YouTube上看了一些教学,其中一个给大家参考,拟定自己的草稿。
接着在面试前,前面做了这么多准备后,已经知己知彼了,知道自己的履历、知道对方的背景、重视的点、面试的模式,就可以以这些元素微调自我介绍的内容,将面试引导到你想走的方向。
其他求职相关Q&A
接下来还有几个求职相关问题,在此简单回答:
面试结束后,如何检讨?
这个部分我就是面试完尽快将面试细节都记录下来,趁著记忆犹新的时候。我现在都是用Notion整理,会有一个Big Board,然后每间Company有自己的Page,里面又会有四个部分:①JD(Job Description) ②面经汇总 ③面试准备 ④面试纪录
https://imgur.com/ZGHDWos.jpg
Job Application Big Board
除此以外,主要就是自己想想面试有哪些做得好和可以调整的。
真的需要花这么多时间求职吗?
我花了一个半月做前期准备,后面从开始积极投履历、走过四轮面试、拿到Offer又花了一个多月时间。中间比较多插曲、意料之外的事、纠结选择的过程让整体时间延长。值不值得,就看个人考量和规划吧。
DA/DS求职准备相关资源分享
SQL
Mode SQL:在开始准备的时候,可以刷一遍Mode SQL复习SQL,或是第一次学也适用。
Leetcode — Database Problems:花个几天把高频50题刷完、整理笔记就差不多了。
A Collection of Data Science Take-Home Challenges — 6 SQL Problems:书里面附 赠的几个SQL题组也是不错的练习。
Python
Leetcode-Algorithms Problems:这就不像SQL那么好准备了。Coding需要准备的强度根据想面试的职位的要求而定,我自己花了不少时间,但是Medium还是没有到稳稳秒杀的程度,Hard就更头痛了。
Pandas:网上有很多Cheatsheet,搜一下就有了。想练习的话,最好的方式是自己做几个Project,从很raw的data开始清理;时间不够的话,可以拿几个DS Challenge练练手;还有一种方法就是用Pandas刷SQL题。
Product & Case
Cracking the PM Interview:我只有大概翻了Estimation, Product, Case三章,可以作为初步的准备。
A Collection of Data Science Take-Home Challenges — 40 Product Questions:我有写一个系列文统整书里的内容,以一个DS角度来解Case,很值得参考,我是说书。
Stellar Peers:这个部落格有很多Product & Case相关的面试题目详解,相当值得参考,尤其对于准备英文面试有帮助。
Victor Cheng — Look Over My Shoulders:我有听一些这个Podcast,就是Victor Cheng带的Case Interview,插播他的解析。可以参考,但是跟DS面试的Case角度还是会有不同。
A/B Testing
Udacity — A/B Testing:网络上大力推荐的课程,可以先简单过一遍。
A Summary of Udacity A/B Testing Course:这篇课程Summary写得不错(我不会承认其实我只看了Summary吧)。
A Collection of Data Science Take-Home Challenges — 40 Product Questions:一样还是这本书,里面有写到不少A/B Testing可能会遇到的问题跟解法。
Statistics
学校讲义:就,很,实用。
StatQuest with Josh Starmer:很多统计、机率、ML的英文影片解说。
Probabilities
40 Questions on Probability for data science:属于比较基本的机率问题,可以简单过一下,顺便把贝氏定理复习一下。
老实说,我有几次机率被问倒,有的涉及到微积分等稍微进阶的题目,所以其实应该要准备得更深入。
Machine Learning
林轩田 — 机器学习基石与技法:以前修课的时候都会说老师教得太数学理论,结果发现面试有时候还真的会考到。
李宏毅:李宏毅真的让ML变得比较可爱、听得下去。我主要针对我有用过的模型跟训练技巧去听。
Medium — Towards Data Science:根据自己想查的模型,常常能在上面看到不错的文章
介绍。
190 道机器学习面试题 & Data Science Interview Questions & Detailed Answers & 七月在线题库:像这种ML面试题我找了一堆,包括中文跟英文的,多到后来放弃ML之路。
Behavioral Questions
这种题目我就是自己看面经想解答,并没有太多参考其他的资料,我记得Cracking the PM Interview里面有一张是在讲BQ的,应该不错。
Big Data: Hadoop & Spark
Udemy:有稍微看过上面的课程(Hadoop & Spark)。但因为之前工作没有实际经验,面试中也没什么被问到。
结语
这篇应该算有诚意了吧。回到开头,我只是希望让Data Science这个社群更好(更卷?),让求职数据相关岗位的人少走一些冤枉路,也纪录下我今年的努力和感谢,我确实是相当有恩典的人,Praise the One Above。
同时,我知道这只是我的一个小起点,Disney+ Hotstar里大部分都是美国名校硕博海龟、或是北大、清华...希望自己能在这个环境下快速成长,在数据之路走得更远。
作者: michellehot (小废物)   2021-11-15 16:47:00
推推
作者: longlyeagle (长鹰宝宝实验室)   2021-11-15 16:57:00
nice 有没有机会请你分享为什么在这些公司里选择这间
作者: kyrie77 (NTU KI)   2021-11-15 18:25:00
作者: yyyyyyyv (vyyyyyyyy)   2021-11-15 18:41:00
作者: pkro12345 (席龙)   2021-11-15 19:20:00
作者: duck10704 (duck)   2021-11-15 19:30:00
推分享
作者: Belieeve (芥末拿铁)   2021-11-15 19:46:00
作者: algorithms (恭喜发财)   2021-11-15 21:45:00
作者: tiramisu0225 (Th'S)   2021-11-15 22:13:00
推 谢谢分享
作者: Inglenook (城市苦守)   2021-11-15 22:29:00
作者: unmolk (UJ)   2021-11-15 23:34:00
详细推
作者: sumsum (simon)   2021-11-16 00:04:00
详细推!
作者: DrTech (竹科管理处网军研发人员)   2021-11-16 00:59:00
一看就知道台大风格,结果真的是台大的有系统,人脉又充足
作者: cip604 (cip604)   2021-11-16 01:12:00
作者: mike8469 (mike8469)   2021-11-16 01:21:00
推推 整理的很仔细
作者: ouskit (ouskit)   2021-11-16 01:49:00
push
作者: lukelove (午睡)   2021-11-16 03:21:00
推分享, 有执行力也有能力也有人脉, 拖着垂老刚刚才上pr的我觉得非常的羡慕, 即便回到你的心我也走不出相同的路*年纪
作者: rr8r8r8r8tw (amp)   2021-11-16 04:39:00
强,可以请教如何20天刷200题高频题吗?
作者: ptta (ptta)   2021-11-16 06:54:00
推 谢谢分享
作者: ian90911 (xopowo)   2021-11-16 09:50:00
感谢分享
作者: AdamLin1201   2021-11-16 11:10:00
作者: WWIII (东邪西毒)   2021-11-16 11:31:00
高手啊 推
作者: azzc1031 (azzc1031)   2021-11-16 12:09:00
同是DA推一下 好强大的执行力
作者: Lightten (Lightten)   2021-11-16 12:32:00
作者: adsl54010 (haha)   2021-11-16 13:00:00
作者: weifan (张小凡)   2021-11-16 14:18:00
推 感谢分享
作者: ukuk666888 (逆战)   2021-11-16 15:27:00
推 强者
作者: luli0034 (luli)   2021-11-16 19:22:00
作者: opencat (opencat)   2021-11-16 23:54:00
这些todo 能在半年准备完 也太神
作者: gnitcue (gnitcue)   2021-11-17 08:18:00
作者: y956403 (寻欢)   2021-11-17 10:00:00
作者: despairF (オタクペンギン)   2021-11-17 13:42:00
作者: awilliea (willie)   2021-11-17 18:52:00
推 超实用
作者: asd0300 (不散之人)   2021-11-17 20:39:00
推推
作者: llltt123 (aka yoko)   2021-11-18 02:06:00
推太神
作者: convington (国民党我家开的)   2021-11-18 02:53:00
台大执行力果然很强
作者: azifang   2021-11-18 03:23:00
推~内容很实在
作者: godsparticle (阿粒)   2021-11-18 08:47:00
佩服 标准台大人
作者: ppoll2 (Stat Counseling)   2021-11-18 22:42:00
作者: PHEj (Vino)   2021-11-19 02:22:00
推 可惜最后没来字节当同事~
作者: r34796a (安安你好)   2021-11-19 20:38:00
妈呀 太神了
作者: Yujjlin (iam1800mm)   2021-11-20 22:39:00
这执行力…佩服
作者: Allenxxxzzz (来沾边的)   2021-11-25 17:51:00
推 有够猛
作者: nietzzzz   2021-11-27 05:07:00
推...
作者: chaohandsome (樵)   2021-12-06 21:57:00
推爆 感谢分享

Links booklink

Contact Us: admin [ a t ] ucptt.com