https://www.ptt.cc/bbs/Gossiping/M.1693830978.A.C03.html
9/4 就在八卦版讲过
8/17 相对低点进去买call https://i.imgur.com/hV3Ykav.jpg
有在follow tesla都
知道啦,只不过新闻喜欢乱写 一堆后知后觉的 看不懂tesla在干嘛
传统自动驾驶
基本分为三大模块
https://i.imgur.com/poTtq9f.png
感知 决策规划 执行
其
中感知不管是纯视觉还是融合感知 都会用AI对图像物体进行识别和标注
从图像中
分离出人和车还有道路边缘障碍物这些东西 然后将标注后的结果发到
决策模块, 决策模块根据感知模块发送的标注结果, 在人类设置的规则框架下给出
决策. 这里的人类设置的规则, 例如红灯停 绿灯行, 人是高危险群体要让行
直
行车道不能转弯, 等等基本规则, 之后进行决策 然后给到执行模块, 控制车辆
因为感知模块给的结果对于决策模块非常重要,如果不能准确识别出物体,自动驾驶
就
会出事, 这也是大家在争论到底要纯视觉还是光达比较安全, 争来争去.
而特斯拉的fsd v12 使用的端到端方法
强大之处, 他没有感知模块, 甚至没
有任何一个模块, 在感知层面上 他不再识别
相机拍到的画面上的讯息, 也
不再进行标注, 他看的是画面上的像素点, 他看的是这些
像素点运行的规律,
把这些像素点讯息直接输入到神经网络
神经网络拥有数以亿计的真实行车影
片,数以亿计的学习经验
就好像stable diffusion一样, 把画师所画出来的
精美图片通通喂给AI建立模型
神经网络会根据现在看到的像素运行方式和学习到的模型进行比对, 直接给到执
行模块
特斯拉fsd 过去拥有30万行代码, v12则是0
这个端到端的自动驾驶学
习方式, 未来就需要各个国家的特斯拉车提供拍摄到的画面进行
学习, 未来
可能会产生中国模型 印度模型 台湾模型 美国模型
甚至模型与模型之间有
可能可以融合
而这样的方式也不是所有车企都有办法, 首先你要有算力, 所
以特斯拉购买了nvda
1万块英伟达h100. 和自行研发的AI训练芯片dojo
特斯
拉在28日启动的10,000颗H100 GPU丛集,会协助训练全自动辅助驾驶(FSD)系统。
H
100 GPU的运算效能是前一代A100的五倍快,可加快特斯拉训练FSD的速度、训
练成果也
会比过去更优秀。不过,H100 GPU非常昂贵,单颗要价近40,000美元
。
由于辉达无法追上市场对GPU的需求,特斯拉只能斥资10多亿美元打造自家
超级电脑“
Dojo”。Dojo使用公司高度最佳化的客制芯片,明(2024)年有望
成为全球最强大的超级电
脑之一。这款超级电脑也会训练特斯拉的车队并处
理这些车队传回的资料。特斯拉执行长
马斯克(Elon Musk) 7月曾表示,“老
实说,若辉达交出足够GPU,我们也许不需要Dojo。
”
而所谓的鲁莽驾驶问题, 特斯拉2年前就想到了, 在先前版本中, 车子就可以为
驾驶员开
车
方式评分, 只丢入评分90分以上的资料即可
相当于你不会
把垃圾画师的作品丢到ai里面去建模型一样
所以自动驾驶要成功
1. 算力
2. 行车数据
以上两点特斯拉都拥有
所以fsd v12 就是自动驾驶的CHATGPT时
刻
也是为什么特斯拉故意留在lv2的原因 他其实是为了在开放道路搜集数据
强化自驾AI