路人路过 讲个自己知道的故事 我妈当年是台大医学检技术学系 她当年跟我说她的
分数可以上北医医科(我觉有点唬烂) 但因为台大名字太香了 加上当年就业前景不差
她就去唸了 没想到等她毕业后 因为科技发展 许多自动化机器产生
造成他们领域的需求人数大幅下降 就业前景整个往下拉
这个故事我一直记在心里 然后这波AI就是这种味道 这波AI所带来的是生产力改善
而不是取代人类 简言之 以前需要100个人才能做的一件事情 现在10个人或者1个人
就可以做到
举个例子
我们之前在Disney 有做过一个类似生产力改善 目标在帮助ESPN运动频道提高生产力
ESPN会去许多大大小学校做二级三级甚至四级运动做运动转播 通常全美可能一天都有
上百场运动赛事 而ESPN团队通常会需要很多camera man 每个摄影机会架在不同角度
抓不同细节 然后会有个主camera man用来切换各个不同摄影机视角 来达到运动转播
那时候我印象中一个团队假设要10个人才能做到的转播服务 我们同事在研究如何
只要两个人就可以办到 原理就是所有camera上面用Computer Vision去追踪不同区域
和不同细节 甚至球员 来取代原本人类摄影师的操作 剩下两个人就可以去微调这些
不同摄影机的细节 当然这件事情不是这样好做 比方以下AI Camera把裁判秃头当
成足球 所以会不断追踪裁判的秃头位置
https://www.youtube.com/watch?v=SPbTKfu0zUY
那回过头来 这几年AI为何能大幅改善?除了算法上外最大的原因就是机器的暴力解
多亏老黄提供超强计算机 现在很多效能改进就是资料暴力解 尤其在Transformer
这种架构可以吃很大的资料 以前train数据动辄几GB就很了不起 现在许多train的数据集
都是>5TB以上
从李飞飞提出ImageNet当初用大量数据集来增加效能 那个时候数据集也不过1TB
但那个时间点已经引起许多效能上改进 加上最近各种self-supervise等架构
都甚至不需要有label data任何wild dataset都可以拿去做训练 各家公司就疯狂用
暴力解 最近的image/text数据集都是几TB起跳
因此得到的结果就是如下