楼主:
meokay (我可以)
2019-05-27 00:04:11大家好,打给厚
最近小弟在看一些NLP的相关工作
有一种感觉是
台湾对于这一块的需求不是那么高?
不知道是做的产业比较没有相关
还是说对于这一块的发展比较没那么重视?
不知道大家对于NLP这一块有没有什么想法
欢迎大家提出来讨论~
谢谢大家
作者:
chengcti (版主请投我一票!)
2019-05-27 00:33:00什么是NLP?
作者: snuriver103 (熙熙) 2019-05-27 00:47:00
Neuro-Linguistic Programming ???
作者: acelp (未来,一直来一直来) 2019-05-27 07:44:00
NLP ASR 国外已经蛮成熟了
作者:
DrTech (竹科管理处网军研发人员)
2019-05-27 09:05:00你打开google 搜一下,买网购搜商品,用到多少NLP ,做点功课都不会?至于说NLP, 有通用解,买大厂API 的,肯定不在这行业做事啦。没通用解。NLP 成熟? 也不是现况吧。
作者:
ejnfu ((-. .-)b)
2019-05-27 09:58:00原po问的也还好吧,这么凶
作者: kiwi94217 (kiwi) 2019-05-27 10:36:00
以做了一些NLP专案还有修课也面了几间之后的感想是,繁体中文资源不足(语料库),简体用语无法移植,歧异词,模型跨领域效能低等等技术问题,从论文研究到企业实作,都无法克服这些障碍,即时有解,商业应用也是很大的难题
作者: transforman 2019-05-27 10:43:00
投资报酬率很低的领域
Dr.tech在中国工作 的确中文NLP还有很多挑战
作者:
qwer911 (NIEONEONE)
2019-05-27 12:49:00个人觉得全部输google
作者:
shter (飞梭之影)
2019-05-27 12:58:00比起语句的理解,我觉得更难处理的是记忆(前后对话关联)
作者:
chupiggy (機器人)
2019-05-27 13:01:00光是中文断词跟NER就还有很多研究空间了其实
作者: acelp (未来,一直来一直来) 2019-05-27 14:44:00
NLP在英文语系已经不是太大的问题 对于一般语句跟目前应用是足够了 而中文缺乏的就只是单纯词库 语法的问题 这都可以克服的至于文章理解 已经到NLU更深入的范畴了
作者:
chienk (.................)
2019-05-27 15:21:00如果做出来只能给台湾人用 那经济规模不足以撑起这个产业
作者:
w199381 (恶心肥宅)
2019-05-27 17:03:00近几年的papers有提出说相近意思的文字在space上很近不知道后续有没有继续发展出一个one-for-all的技术?
作者: acelp (未来,一直来一直来) 2019-05-27 19:17:00
word embedded or vector 就已经算是one for all了
作者:
drph (Peter)
2019-05-27 19:22:00学校请自己写学校作业
作者:
DrTech (竹科管理处网军研发人员)
2019-05-27 21:44:00钓出一堆外行人。目前还没出现通用的word embedding技术。word2vec 到现在的各种预训练语言模型,例如bert。 都还不能跨领域来用。简单的一词多义,word embedding 都没办法跨领域有不同的表示了,只能换不同的 corpus 重新训练。至于投资报酬率低更是误解。google 最大营收,广告收入,就是NLP学得好的例子与方向。更不用说台湾现在烂到爆炸的购物商品推荐,也是市场上商机最清楚的机器学习应用点。BERT 模型,看起来通用,实际上在各领域或各种 task , 还不是要在神经网络架构上层, 重新训练。所以个人认为,目前很难有万用模型啦。
作者: acelp (未来,一直来一直来) 2019-05-27 22:16:00
谁跟你说过word embedded 是通用的?不同应用本来就要重train...如果你要万能模型 请慢慢等吧 台湾做不出来就是这种短视近利 国外ASR NLP都做多久了 而且要相互搭配台湾过去根本没基础 又短视近利 又想一步登天 这才是好笑的地方
不是阿 万用模型 本然就是指 你可以用那个架构重train不过短短几行推文 也难以了解彼此意思 不过直接喊外行也是太偏激了点就是
作者: transforman 2019-05-27 23:05:00
少加了点字,在台湾报酬率低
NLP会说通用解是指应用情境 很难差异化 资料大者通吃翻译 购物推荐 ASR 都可以看出谁是领先者然后换个语言和情境 多一种排列组合不然想听听DrTech 对GPT2在写文章上的领先有什么高见
作者:
DrTech (竹科管理处网军研发人员)
2019-05-27 23:50:00抱歉,短短推文的确有误解。感谢你后来的说明,看懂了。
作者:
Arnol (还是太浅了)
2019-05-28 09:19:00我只会PLP
作者: acelp (未来,一直来一直来) 2019-05-28 09:36:00
澄清是误会就好 台湾这块真的落后不少 学界当初也做得不够深入 甚至都转组 现在潮流一变迁就只能找海归了
作者:
chengcti (版主请投我一票!)
2019-05-28 11:04:00你知道直销 最爱用NLP
作者: eatpupu (吃大便) 2019-05-28 11:08:00
NLP 本来就是坑,语言是被人类定义出来的东西
作者:
chienk (.................)
2019-05-28 17:00:00不是国外风风火火的东西 都适合拿回来台湾做 台湾需要认清处自己在世界产业中间的位置