Re: [请益] 成为 AI 工程师的进修方向(代po)

楼主: cckk3333 (皓月)   2021-07-01 22:38:19
※ 引述《techniclaire (齁齁)》之铭言:
: (本文作者无帐号,协助代po ^ ^~)
: 前文少po段落就送出,因手机一直无法编辑,所以删文重发QQ
: 大家好,
: 小弟目前在台北某传产担任数据分析师,学历是国立统计所,硕论是做 ML 算法改良(没投期刊,我觉得是垃圾),硕班期间有自修 DL。
: 希望能用 DL 找工作,主力程式为 Python。
: 目前刚进去公司半年多,主要负责影像辨识的专案,内容是用 Yolo 进行 real time 的瑕疵检测,专案目前也已经上线了,因此算是有一些实务经验。
: 看了蛮多 ptt 上的文,对目前 AI/DL 工作的现况总结如下:
: - 做 DL 的人已经烂大街了,几乎每个实验室都在做 AI
: - 想做算法 / 模型开发的话至少要念到博士
: - 基础资工能力非常重要,没人要只会 DL 的人
: - 刷 Leetcode
: 考虑以上、总结目前目标是成为一个“能将现有较新的 DL 方法应用在公司产品上”的工程师,希望将来能到联发科、瑞昱等一线 IC 设计公司工作。
: 目前我想到的进修方向如下:
: - 持续关注 AI/DL 的发展,了解现在的趋势,并且参加一些像是T-brain、Kaggle 之类的比赛。
: - 修李宏毅老师的 ML 相关课程,我这学期有跟着写一些 ML 作业,觉得自己的 Pytorch 熟悉度有提高很多
: - 学 C++ (主要是看到如果模型要应用的话还是得用到 C++,而且有些模型像是 Yolo 也是用 C++ 写的)
: - 把资料结构及算法学好,刷 Leetcode
: - 做一个深度学习专案,例如把 Yolo 模型迁入到手机中
: - 增进英文能力,方便吸收国外资源及看论文的速度,有没有推荐内向人的英文口说学习资料或是补习班。
: - 其他,例如增进简报能力
: 想请问各位先进,我目前的想法有需要调整的地方吗(or 打掉重练qq)
本人工作6年多
目前经历的两份工作都跟ML相关(预测相关)
依照本人的经验 我会建议两个可能的方向
其他方向或许也有机会 不过我不太熟就不发表意见了
(1) 认真打 kaggle
假设你可以长期都可以solo拿到银牌 (可能每天二三个小时)
(金牌需要非常多的时间,运算资源,运气 很难强求)
尤其是不参考别人 我觉得都有相当的能力
依照我的了解 台湾真的kaggle打得好的人其实很少
而且不少公司都在找这些人
这些人有相当的市场价值
本人虽然已经非常久没有打kaggle了
但我觉得打kaggle的人有一些特质
第一是他们会减少一些信仰, 让结果说话
相对于没经验的人 他们可能会更小心的设计 validation set
并且跑过相当次数 验证 validation set / test set 进步的一致性
正常人可能随便就选了 n-fold cv / train-validation 的架构
然后就开始grid search hyperparameter
然后有一些感觉上很有道理 (paper上哪个模型比哪个模型好, 一些很直觉的feature)
但实际上却不怎么work的事情 会接二连三的发生
一些小到让人觉得微不足道却影响最后的事情 也会接二连三的发生
因为每几个月就换一次比赛 你内心可能就会改变各种方法的信心度
书本上教的A方法 信心度可能从95% -> 60%
讨论区看到让人半信半疑的方法 信心度可能从40% -> 80%
所以对于大部分的问题 你会有一个武器库
从信心度最高的一个一个试
另外因为资料会有些微的不一样
所以每次你可能要快速地想 benchmark 跟 处理一些杂事
我觉得这个过程大概可以到你打完一个比赛觉得自己什么都没有学到就差不多了
(2) 找一些结果相当容易量化的 project 来做
结果相当容易量化的通常都是只target明确 比较不是偏 unsupervised 的题目
尽可能的让target的成效变好
比如 预测台股 扣除掉模型的差距
你可以学习如何爬资料(三大法人, 期货, 分点, 财报)
你会长期觉得现在是试新资料比较重要还是新模型比较重要
如果你能把预测变成交易策略 搞不好还可以发财(?
这样别人在问你project的时候 才可以让面试官觉得你可以把一个题目做到很深
不会一下就卡住了
我自己觉得这两个方向的人都蛮吸引人的
以我自己的感觉来说(主观)
这样的能力 会比用套件跑了某个结果 然后呈现在某个app或者网页上的人吸引人
作者: lunasdejavu (我的头上长香菇了)   2021-07-01 23:40:00
写self-supervised 比较对,unsupervised是指data
楼主: cckk3333 (皓月)   2021-07-01 23:55:00
我不是cv出生的 不过单看 shorturl.at/kmEK4 来说self-supervised learning似乎是unsupervised learning的子集合 不过我要讲的是有些paper会建立某种机率模型然后找最大likelihood的参数 在用参数或分类结果讲一些故事 我个人认为这一类的研究是相对难应用在业界上也很难做得很深
作者: viper9709 (阿达)   2021-07-02 00:04:00
台股预测超准以后就不用上班了(误)
作者: z888888861 (大泡菜)   2021-07-02 00:10:00
推!!!
作者: xavierqqqq (Eye烟雾弥漫)   2021-07-02 00:22:00
作者: Mchord (Mchord)   2021-07-02 00:26:00
我觉得找工作还是看background knowledge比较多,建模的能力强到人家愿意让你跨领域不太容易
作者: neo5277 (I am an agent of chaos)   2021-07-02 00:53:00
洞洞版可以串出来的东西很多剩下就是用勇气补足这样
作者: taipoo (要成功要积极)   2021-07-02 01:05:00
谢谢分享
作者: wahaha279 (哇哈哈:3)   2021-07-02 02:11:00
优文推,一楼搞错了啦
作者: Royne (哲哉)   2021-07-02 07:37:00
作者: SPower (微光)   2021-07-02 08:58:00
作者: ropaz9171   2021-07-02 10:47:00
作者: y956403 (寻欢)   2021-07-02 11:37:00
作者: DrTech (竹科管理处网军研发人员)   2021-07-02 12:35:00
现实有上线的产品,其实重点都不在 kaggle 或是debug工具程式。 你根本没有 kaggle漂亮的资料。我都很怕遇到发论文强,或者比赛强,到真实世界,却只剩各种技巧的人。
作者: libitum (libitum)   2021-07-02 13:52:00
看要找什么level的人啊 还真没听过有kaggle成绩背书会变成一种包袱
作者: sammythekid (山米乐其得)   2021-07-02 13:55:00
实务上就是面试时,我说我都自组团打kaggle耶面试官:喔并不是说不加分,不过实务上真的看公司了&面试官了我会说还要五年。等我们这批人有办法爬上那个位置kaggle的资料近几年也"不干净"了啦XD 光清理资料就是竞赛流程之一其实大大们说的都对,就是现实世界各种还没跟上潮流或者是说,每个拿着片段的偏误,就认定原来就是这样就会变成很可惜。就都是工具,能善用都是能打仗
作者: libitum (libitum)   2021-07-02 14:24:00
在entry or jr level,要看的就是对模型等知识的了解程度kaggle里的已经很hands on projects了 很好证明有该有的知识能力 等要面试sr level 考量的又是其他方面了 不能否认 这时再拿kaggle的经历出来 效益没那么大
作者: lunasdejavu (我的头上长香菇了)   2021-07-02 21:24:00
不Lecun自己都说过要正名了,因为没有真正unsupervisehttps://pse.is/3kep52
作者: bear1414 (story)   2021-07-04 15:58:00
面试时 kaggle加分有限第一作者+中上会议 = 真实案例算法有效益 > Kaggle只有KAGGLE的人 会需要加上小专案测试真实能力
作者: shaufire (喵)   2021-07-05 19:04:00
推~
作者: shownlin (哈哈阿喔)   2021-07-08 18:44:00
kaggle太多奇技淫巧 如果奇技淫巧练到走火入魔反而没有商业价值
作者: simpleplanya (三十年岁月 五十亿巨资)   2021-07-11 22:02:00
推唷

Links booklink

Contact Us: admin [ a t ] ucptt.com