[请益] 关于 NLP 如何自学(书/公开课程)?

楼主: cylee (Artisan)   2022-05-28 19:20:14
Hi 各位先进,
本人背景是毕业很久的资工硕,目前从事 infra 开发的 back-end
engineer,目前待的公司准时上下班,想学些能累积技术的主题
熟悉的语言有: C++/Python/Rust
因为在学时完全没接触过,想请问有碰过的先进们,自学的话有没
有推的书、公开课能分享。另外 NLP 现在业界真的拿它来赚钱的公
司/组织是不是偏少(台商),还是只是我没碰到而已?
谢谢各位
作者: Lushen (wind joker!!!)   2022-05-28 19:32:00
唯一推荐台大李宏毅https://bit.ly/3M35yFa基本上算台湾讲的最通俗易懂了尤其推荐他的 ML 课程 讲的真D猛
作者: pha123661 (pha123661)   2022-05-28 23:32:00
NLP线上课程推荐 Stanford CS224N:https://www.youtube.com/playlist?list=PLoROMvodv4rOSH4v6133s9LFPRHjEmbmJ
作者: NTUmaki (西木野真姬)   2022-05-28 23:55:00
台大2个教授有开放课程又有名的就是做NLP的 可以先看他们的影片(陈 侬、李宏毅)
作者: kkes0001 (kkes0308)   2022-05-29 08:30:00
nlp只碰过学界的居多,业界很少
作者: ElegonSin (南部人)   2022-05-29 09:32:00
看教授影片+自己动手玩玩看简单的python 我推simple transformer我觉得NLP最常见的应用可能就像是YT的推荐影片
作者: oachan (阿诚)   2022-05-29 11:10:00
电商搜寻、推荐、对话机器人、RPA也是有不少题目可以做的
作者: DrTech (竹科管理处网军研发人员)   2022-05-29 11:56:00
差很多吧,推荐系统recommendation 与NLP,与搜寻引擎,在学术界,业界完全是不同专业。除非你去烂公司,乱做一通没实战的公司,不然你做search,nlp,recommendation 要做的事情,完全不同。资历也不通。搜寻,要怎么ranking,nlp的人通常都不会。推荐系统,要怎么做多模态(multifmodal)的特征,通常NLP,搜寻的人又没碰过。彼此之间专业真的差很多。另外NLP的各种序列标注模型,搜寻与推荐的团队,根本没几个人有碰过。专业完全不同。最后,搜寻与推荐,很多资料pipeline的工作,都与机器学习与NLP无关。
作者: sachialanlus (yeh)   2022-05-29 13:14:00
我研究所学nlp 但工作找backend 跟你相反赚钱与否不清楚 但nlp工作其实不少 台商也有
作者: DrTech (竹科管理处网军研发人员)   2022-05-29 13:22:00
真正拿NLP来商业化赚钱的,不是哪种旁门左道,做好玩,或是做了NLP没效益也没差的部门喔。我在台湾看了几年台商不到3家而已。NLP工作是很多啦,但是拿来赚钱变现的公司,台商绝对没有5家。
作者: sachialanlus (yeh)   2022-05-29 13:26:00
确实有可能是这样没错 而且我看到的nlp缺都和medical相关 我猜现阶段应该都赔钱 放眼未来的感觉
作者: DrTech (竹科管理处网军研发人员)   2022-05-29 13:26:00
而且大部分公司,就是要你会ope source 就好。讲太多太深的别人也听不懂。
作者: sachialanlus (yeh)   2022-05-29 13:33:00
我选nlp是因为像是怕cv饱和 押宝nlp 但做了才发现自己对nlp的兴趣不高 后来就选有兴趣的web 薪水也不错
作者: oachan (阿诚)   2022-05-29 14:15:00
同意大大说的,台湾纯NLP工作少,大部分学NLP都是找外商或是其他相关应用领域
作者: jamfly (jamfly)   2022-05-29 23:12:00
Huggingface 套一下 应该是很多地方的常态…
作者: recorriendo (孟新)   2022-05-30 01:48:00
Search跟NLP没差那么多啦 vector space model就搜寻引擎开始用的 NLP后来引进 (不过我后来发现很多人不知到这段历史 以为vector space model是十年前左右NLP的大发明) 排序的部分也就几个公式而已说实话现在很多搞NLP的几乎都不懂IR的一些经典技法了 tf-idf之类的 其实很多时候可以拿来作快速prototyping
作者: DrTech (竹科管理处网军研发人员)   2022-05-30 09:36:00
楼上,现在线上有哪个主流的搜寻引擎或商品,是用vector space做的?或tf-idf做,然后去搜向量?没有吧。速度慢,效果又差。排序部分就那几个公式?你们的产品是什么场景,CTR多少呢?正常商品怎么可能几个传统公式就能搞定。另外,传统IR根本不管用户特征,只管文字上表面相似度,这也是现代化搜寻系统与NLP工作差异极大的地方。NLP为什么工作少,是因为没有独立能赚钱的应用。到最后能赚钱的搜寻,推荐,广告业务,会用到NLP的技术比例其实没那么高。如果是纯赚钱考量,还不如直接去学搜寻,推荐,广告。NLP有遇到需求再学较好。
楼主: cylee (Artisan)   2022-05-30 12:03:00
多谢各位的建议,我的起始点就是想要学一个有技术壁垒的技术,而不是别人学几个月就宣称他能上手的。
作者: recorriendo (孟新)   2022-05-30 12:50:00
我说IR以前用vector space modelNLP现在在用 上面是看不清楚推文乱曲解IR排序比NLP多的就是那些公式 现在当然都用deep learning 你要说这个那差异更小另外 国内要做search 大多就给客户内部使用而已 还真的是老公式套一套就够了 (当然直接用package更快) 而面向大众的搜寻引擎 现在就是google独占市场 其他做也是白做
作者: penniless   2022-05-31 00:48:00
推楼上,感觉某楼在diss传统操作挺外行的。而且绝对没有什么领域差很多这种事。ACL了解一下,看看有多少是搜索推荐相关....

Links booklink

Contact Us: admin [ a t ] ucptt.com