Re: [请益] 想从零开始转行当AI软件工程师

楼主: k300plus (300plus)   2021-11-12 20:49:56
嘛,看到这标题,身为本命爱蜜莉雅的肥宅工程师也来鼓励(?)分享一下
本肥在112读大学时修过CSIE田神的ML
犹记得当初只会写C/C++的自己
在没人提示的情况下,蒙逼的手刻各种矩阵运算,一个作业写了上千行code
在EE的繁重课业下忍痛停休
然而还是有去把整学期的课听完,说实话ML/AI背后的数学理论真的收获很多
后来读硕班时正好就是李鸿毅开ML的第一年
我也才第一次接触到python这个暴力且强大的直译语言
除了有超多数学相关的lib能够无脑call爆外,最重要的还是处理data的能力
那时瞬间搞不懂自己大学修ML时到底在瞎忙什么
如果有个拿着流星锤的蓝发女仆
我会跪求他马上砸死我,让我re到大学时期的德田馆www
随着前两次的作业结束,觉得写python也太简单爽快,突然发现自己好想往ML/AI发展
然而学期后半段进入了类神经网络后,一切开始风云变色
第三次作业的data再怎么前处理,模型layer再怎么叠,kaggle上的分数始终惨输
太无情了,我的信心似乎崩溃了
最后作业结束时,记得老师请前几名的同学上台分享他们怎么做的
结果...我震撼了
上台分享的同学大致上也都是乱叠乱串一通,然后分数就突然超高而已
从此,我的AI梦好像也就嘎然而止了
时光荏苒,转眼间我已是在猪屎屋挑屎挑了三年的肥肥工程师
即使工作内容完全与AI无关
但李鸿毅的那门ML却是深深的影响着我
自家产品的log项目乱七八糟怎么办? python读出来分类啊
一堆没用的肮脏数据怎么办? 用python踢掉啊
别人给的excel/csv格式排版不是我想要的怎么办? python重新输出啊
反正数据处理方面,python根本神到翻天
再搭配shell语法,各种杂事过来就是一切先自动化处理再说
其实我也不知道别人是怎么做
但有这些tool对我分析数据上来说就是如虎添翼
但要是我没修过ML,学到python的处理资料能力
搞不好我现在就还是在用C或人工在处理资料
也许AI风潮不再那么狂热,如果AI有颜色那一定是过气的蓝色
但还是很鼓励可以去接触看看,也许也能像本肥一样收获良多 > <
甚至我认为各个领域都非常有机会运用到处理资料的能力
而透过ML/AI去学习如何处理资料是非常好的一个方式 (灿笑
作者: stmilk (我男的)   2021-11-12 21:03:00
屌耶,就像贾伯斯旁听字体美学一样,命运就是这么神奇
作者: Morphee (千磨万击还坚劲)   2021-11-12 22:02:00
你讲的那些处理 perl跟tcl/tk 不是都玩到烂了?
作者: j0958322080 (Tidus)   2021-11-12 22:26:00
结果你讲的是 python 有多强不是 AI 阿不过说实在的很多 library 底层还是 C 实作才快有些甚至还是 Fortran
作者: mmonkeyboyy (great)   2021-11-12 22:32:00
fortran是没办法
作者: drajan (EasoN)   2021-11-12 22:36:00
快很好 但正确 易用 才有市场Speed is irrelevant if you are going in the wrong direction.
作者: leo08210917 (leo)   2021-11-12 22:48:00
这篇是在说 在猪屎用python打杂混的比做ai好吗XD
作者: viper9709 (阿达)   2021-11-12 23:42:00
推拿流星槌的蓝发女仆(误)
作者: yamakazi (大安吴彦祖)   2021-11-13 00:07:00
底层Fortran?Python 底层是C没错,但底层Fortran我见识少还真没听过
作者: j0958322080 (Tidus)   2021-11-13 00:29:00
之前看线性代数有用到 lapack 里面有 Fortran 的语法
作者: LincolnBoy   2021-11-13 00:30:00
Fortran好怀念 好久没写了
作者: mmonkeyboyy (great)   2021-11-13 01:02:00
那一堆线代解的里面很多都有fortran不信你下次compile时不要叫 gfortran看看立马死一堆XD
作者: wahaha279 (哇哈哈:3)   2021-11-13 01:18:00
去搞懂直译的意思 而不是在那边我见识少
作者: shownlin (哈哈阿喔)   2021-11-13 01:59:00
Kaggle有时候真的就是比模型本身的强度有的模型就是特别适合拿来打比赛用对模型基本上分数就会飙上去剩下的就一些细节在那边看能不能多拼个几分之前修轩田的final project有感看leader board前面有些组很好心submit还会附上自己用什么模型XD
作者: yamakazi (大安吴彦祖)   2021-11-13 09:47:00
我知道有些科学计算用Fortran 啊,我的意思是,有多少主流套件,或程式,或OS底层是用Fortran?印象中几乎没有或者本系列主题是AI,有多少搞AI工具底层是Fortran写的?
作者: hprince (工口王子)   2021-11-13 10:09:00
结果签名档没放爱蜜莉雅
作者: yamakazi (大安吴彦祖)   2021-11-13 10:10:00
而且现在科学计算主流不是几乎都python和matlab了?
作者: mmonkeyboyy (great)   2021-11-13 11:10:00
Blas里还有fortran 77 没死透 而且有几个还比c快 就被留下来了你如果说的科学计算是量子电脑 那python 是 超级电脑类 python 用很少很少 matlab 就 算了吧解数值的 FORTRAN 活的很好呢 只是包住你看不到拿cpu 解DL的 fortran 也用到很多 GPGPU 我猜也有
作者: yamakazi (大安吴彦祖)   2021-11-13 11:50:00
没死透不就代表死的差不多了?死的剩一口气而已
作者: j0958322080 (Tidus)   2021-11-13 11:55:00
看你怎么定义啊,如果那几个函式被呼叫的次数是高过其他用 python 写的好几个数量级算吗?
作者: yamakazi (大安吴彦祖)   2021-11-13 12:13:00
我就只是好奇到底多少底层用Fortran写的现在还在用就是了
作者: j0958322080 (Tidus)   2021-11-13 12:15:00
你去看看哪些呼叫 blas 阿
作者: yamakazi (大安吴彦祖)   2021-11-13 12:27:00
看起来就是特定领域的少数套件才会用到底层是fortran 写的库而且我刚看了一下,也不是所有blas都是用Fortran,openBlas就说是用C写的
作者: mmonkeyboyy (great)   2021-11-13 12:43:00
我也没有说全部啊 = ="不跟你说compile下去就知道了
作者: yamakazi (大安吴彦祖)   2021-11-13 12:43:00
OpenBlas说C compiler必备, Fortran compiler是选配
作者: mmonkeyboyy (great)   2021-11-13 12:45:00
= ="谁跟你少数领域 囧> 又不是人人都openblas更别提nv 自己都出fortran= =" 你要看接谁啊 你跑一个solver 要看它叫谁它没叫你可以自己接啦....接很久就是了xd你真觉得没用就没用啊= =" 看一下各大名校都还在教还一堆是重课 = =" 你做数值拿来模拟各种东西solver 下去就是很有可能会有 @[email protected]~
作者: j0958322080 (Tidus)   2021-11-13 12:49:00
可能他没接触过的领域就是少数领域吧
作者: mmonkeyboyy (great)   2021-11-13 12:49:00
我讲没死透只是因为我自己也是在帮忙更新到c的但 超多好吗= =" 你一堆工程化学药学医学都有会说科学计算可以用matlab 我只能笑了....python都到很最近才排得进去好吗....世界排名前百大超级电脑 (量子不算的话) 有没有十台可以让你跑python都是问题 (当然商用出租的不算 这付钱的是老大) matlab....不知道有没有一台就我记忆中 mathworks曾想去推 一个大老叫它先跑赢java 再来.... 然后我知道大家都会放一台让小朋友在
作者: yamakazi (大安吴彦祖)   2021-11-13 12:54:00
所有以我说我见识少,没跟你们讨论我还真不知道有这个
作者: mmonkeyboyy (great)   2021-11-13 12:55:00
一边先玩沙 玩完再叫你改成c++先某意议上来说openblas很先进的 先进到没有fortran这是当初很多人对这东西的评价 (算一半好坏)这东西是对岸出的 专门为了某东西做的你把fortran 先拿掉 然后重compile 全部东西我认真觉得在linux 环境下 你会有一半以上hpc残废那东西包得太深了....深到我还见过比f77还旧的
作者: yamakazi (大安吴彦祖)   2021-11-13 13:11:00
为什么要更新到C?是指重新用C写吗?
作者: mmonkeyboyy (great)   2021-11-13 13:13:00
很多东西你可以用c/c++的对应东西换掉在某程度上 会有优化上的好处 最少内存好做我看了一下我手正在搞的一个大包 里面还是满满f啊老的东西很难丢掉的@[email protected]~ nasa想丢了fortran 才总算在2017年动手 (不过到底丢完了没我也不知道)那有什么时间在重写 当没事重造轮哦@[email protected]~当然是把别人写好的移过去 做一堆事让它工作
作者: kevin820308 (fdsfssdas)   2021-11-13 13:24:00
这篇讲话www 好有画面(抓头灿笑
作者: bill1992 (我是魔法的踪迹)   2021-11-13 13:48:00
整篇重点 太无情了 无情data
作者: bochengchen (LFII)   2021-11-13 14:07:00
data好难
作者: richardz (卍罪爱卍)   2021-11-13 16:12:00
雷姆派只能嘘了
作者: zebraseven (Die walkuere)   2021-11-13 23:26:00
作者: cominlin (DiawCat)   2021-11-14 12:13:00
可恶 谁说蓝发的过气了 她不就叫做......欸......叫什么
作者: ricson (小僧)   2021-11-14 12:50:00
欸不是 你本命怎么没出现在签名档
作者: mmonkeyboyy (great)   2021-11-15 00:16:00
想当年我们都是初音 凉宫的 囧>(过气的宅宅 泣T_T)_
作者: pjwck (pjwck)   2021-11-16 01:12:00
听起来你只是需要早点认识python而已跟AI真的无关
作者: eva19452002 (^^)   2021-11-17 02:18:00
Python 底层是C,那为何不直接用C就好?
作者: damody (天亮damody)   2021-11-17 03:33:00
噗杀天使吗
作者: longlongint (华哥尔)   2021-11-17 12:50:00
省人类的时间比省机器的时间重要
作者: mmonkeyboyy (great)   2021-11-18 13:19:00
是要决斗泥~
作者: Yujjlin (iam1800mm)   2021-11-20 22:47:00
拿到一堆肮脏数据,真的很想哭,该复习python…

Links booklink

Contact Us: admin [ a t ] ucptt.com