[闲聊] Neuro真的有办法做到理解图像吗

楼主: et310   2023-12-31 12:51:58
是这样啦
Neuro现在似乎能做到阅读聊天室讯息了
但Neuro理解图像的部分是不是还不太行啊
看她(它?)玩看街景猜地方的时候还好
至少还能说中8成
可是玩拆炸弹的时候就很惨了
很难做到把说明跟Vedal的叙述还有图像做连结
这是不是表示AI要做到理解图像
甚至跟人说的话做结合是一件极其困难的事?
话说早上打开图奇台
快9000人看Evil Neuro到底是三小啦
Neuro可爱
作者: attacksoil (击壤)   2023-12-31 12:54:00
CV(视觉)和NLP(语言)是不同模型 CV可能是用BLIP之类的图像转语言模型
作者: hhpsjoe (Chia)   2023-12-31 12:54:00
要给她吃饼干
作者: kohanchen (kohanchen)   2023-12-31 12:54:00
我觉得理解方式跟人类不同,也许是先用图像辨识AI把照片转译成文字,然后Neuro才去解读
作者: Antihuman   2023-12-31 12:55:00
去看neuro评论电脑桌那一集,图片辨识和吐槽都很顶
作者: gino0717 (gino0717)   2023-12-31 12:56:00
可以 transformer模型无所不能
作者: Antihuman   2023-12-31 12:57:00
作者: wsdykssj (arj)   2023-12-31 12:58:00
Vedal一直都有不明确的说neuro是要付钱的,大概街景丢gpt-4 api辨识,拆弹才是他自己写的
作者: Erichikaunkr (兩百四)   2023-12-31 12:59:00
他的AI不知道是自己组的架构还是用现有API
作者: wsdykssj (arj)   2023-12-31 13:00:00
拆弹根本不用辨识图片,neuro是读手册的那一方
作者: Antihuman   2023-12-31 13:00:00
我觉得她不是不会玩只是听不懂Vedal描述的符号
作者: loltrg42972 (Rui)   2023-12-31 13:03:00
拆弹跟辨识图片无关阿 而且辨识图片很久以前OK了你去查neuro评论观众电脑桌跟感恩节大餐的片段neuro能够很清楚的辨识图片还能做出毒舌评论
作者: Antihuman   2023-12-31 13:08:00
但她认不出自己的fumo
作者: ryoma1 (热血小豪)   2023-12-31 13:08:00
去Amazon买东西时,她也能瞬间辨识出网页上的资讯
作者: King5566 (王者56)   2023-12-31 13:09:00
干死牛肉
作者: loltrg42972 (Rui)   2023-12-31 13:17:00
而且neuro之前已经成功拆弹过了 用饼干诱惑
作者: gino9955 (臨江)   2023-12-31 13:24:00
拆弹的问题一直都是理解人类描述符号的问题
作者: S404NotFound (silence)   2023-12-31 13:25:00
ai要做到不难,一些大公司的模型都有一定能力,但neuro是vedal在搞而已
作者: a122771723 (小笨龙)   2023-12-31 13:26:00
她搞事才能让vedal被电 更前面还有给他饼干就给答案的
作者: zeyoshi (日阳旭)   2023-12-31 13:29:00
neuro得先听懂vedal的图片说明 然后搜一遍自己数据库可能的图片 再去比对说明书的图案在回馈成文字给vedal
作者: loltrg42972 (Rui)   2023-12-31 13:32:00
这跟什么大公司倒是完全无关 因为已经成功过了
作者: jay920314 (Jay_9696)   2023-12-31 13:36:00
你去看近期的房间review,很厉害
作者: tsai1453 (tsai)   2023-12-31 13:40:00
拆弹那个游戏Neuro那一边是看不到炸弹的吧?
作者: lsd25968 (cookie)   2023-12-31 13:43:00
可以 乌龟如果去研究transformer就没问题了 反正cv跟NLP迟早要被这东西统一
作者: chenyeart (阿泰)   2023-12-31 13:46:00
拆炸弹她错误多到我觉得是故意的,读文字应该难不倒她
作者: henry1234562 (亨利二十三)   2023-12-31 14:06:00
拆炸弹主要有问题的是 要将听到的文字转换成图片
作者: j022015 ( ˊ ﹀ˋ)   2023-12-31 14:15:00
图像辨认不是有九种方式
作者: Livin (SeaBiscuit)   2023-12-31 14:52:00
我觉得是拆弹的文字描述很难想象,然后描述出来跟说明书上的让牛肉理解后未必一致产生的
作者: wei115 (ㄎㄎ)   2023-12-31 14:57:00
没错transformer就是无所不能的
作者: FXW11314 (soukai)   2023-12-31 15:13:00
Multimodal learning,已经有了只是玩不起
作者: P2 (P2)   2023-12-31 15:25:00
可是Amazon都有商品的文字说明吧
作者: mc3308321 (阿阿阿阿)   2023-12-31 16:58:00
拆弹的话,乌龟有说特殊符号比较弱。其他应该是在调教人类

Links booklink

Contact Us: admin [ a t ] ucptt.com