来源:
https://bit.ly/30866Fa
文章很长,建议有兴趣的人看来源(中文,只有部分内容),若有条件的话最好
是看原文来源(英文):https://bit.ly/36XTzFG
不过原文有点长,当初我花了两三天才分段看完,当初看完后原本想发,但因
为太长了只翻到一半迟迟没发。现在看到原来有人写成中文文章,就转发过来,
不过这份中文文章也只是简介并且只有前面约1/4 的内容。
这篇文章是从市售车(Tesla)与试验车(Volvo、Waymo) 将其车上的感应器做分
类介绍并且就背后的原理、软件方法等逐一做介绍,从内容中也可以看到各家
目前对无人驾驶的意见很不一致,例如Mobileye 与MIT 对于高精度数位地图的
看法就很不一样:
“If we want to have autonomous cars everywhere, we have to have digital maps
everywhere”
Amnon Shashua, Chief Technology Officer at Mobileye, 2017
“The need for dense 3-D maps limits the places where self-driving cars can
operate.”
Daniela Rus, director of MIT’s Computer Science and Artificial Intelligence
Laboratory (CSAIL), 2018
而对于将无人驾驶技术放到燃油车上M-Benz 也说这没有任何意义,因为会使油
耗大幅度增加:
“To put such a system into a combustion-engined car doesn’t make any sense,
because the fuel consumption will go up tremendously,”
Wilko Stark, Vice President of Strategy, Mercedes-Benz, 2018
而对于该使用DSRC 还是C-V2X,意见也是非常的分歧。
而最知名的歧见大概就是光学雷达派与视觉辨识派,光学雷达派认为光学雷达
是必要的,若成本下降就连Tesla 也会开始装光达。
而视觉辨识派像是Elon Musk,他认为问题在于视觉辨识,人类都能靠两只眼睛
开车了,而处理速度更快的摄影机也可以,而且就算用上光达,都是要解决视
觉辨识问题,一但解决了视觉辨识问题,那么光达就显得不必要而且昂贵,如
果你解决不了视觉辨识问题,那你就解决不了无人驾驶问题,有光达也没用。
同样的Nissan 也认为,光达目前缺乏超越雷达和摄影机的能力。
“Once you solve cameras for vision, autonomy is solved; if you don’t solve
vision, it’s not solved … You can absolutely be superhuman with just
cameras.”
Elon Musk, 2017[19]
“At the moment, lidar lacks the capabilities to exceed the capabilities of
the latest technology in radar and cameras,”
Tetsuya Iijima, General Manager of Advanced Technology Development for
Automated Driving, Nissan, May 2019[20]
“Let’s be candid, lidar is unaffordable in consumer vehicles, but if a
lidar unit were available today that had good performance and was affordable,
it would quietly show up in a Tesla car and this whole hubbub would go away.”
Bill Colleran, CEO, Lumotive, June 2019[21]
像这样广泛的介绍无人驾驶技术各方之间的主张在文中相当的多,有兴趣的人
真的可以好好找时间读一读原文。
https://i.imgur.com/uZnRhZf.jpg
2020 最新自动驾驶技术报告出炉!以特斯拉、Volvo 为例,全面涵盖智驾技术
进入 2020 年,自动驾驶技术跨越式与渐进式路线的阵营划分已十分明显,但最终自动驾
驶要完全自动化,技术还需要不断更新发展。
对自动驾驶的技术进展,WEVOLVER 发表的《2020 自动驾驶技术报告》(2020
Autonomous Vehicle Technology Report)做了全面阐释。
报告从传感、规划、执行三层面阐述自驾车技术的最新发展状况,涉及传感器、资料处理
、机器学习、SLAM 与传感器融合、路径规划等多领域,同时提供多家自动驾驶公司的案
例,包括特斯拉、Volvo、Waymo 等。
传感
自驾车是在未知动态环境执行,所以需要事先构建环境地图并自我定位,而执行同步定位
和对映过程(SLAM,即时定位和地图构建)输入则需要传感器和 AI 系统帮助。
报告指出,传感器可分为有源传感器和无源传感器,各种传感器都有优缺点,没有单一感
测器适用所有路况。通常情况下,想可靠安全操控一辆自驾车,需要同时使用多种传感器
。
一般情况下,自驾车传感器主要有 5 种:
远端雷达:讯号能透过雨、雾、灰尘等视线障碍物侦测目标。
照相机:一般以组合形式探测短程目标,多应用于远距离特征传感和交通侦测。
光学雷达:多用于 3D 环境对映和目标侦测。
短程/中程雷达:中短程目标侦测,适用侧面和后方避险。
超音波:近距离目标侦测。
各类传感器均有优缺点,而自驾车需要从技术判断选择传感器,筛选条件主要有几方面:
扫描范围,决定传感器反应传感物体的时间。
分辨率,传感器可为自驾车提供多少环境细节。
视野/角度分辨率,决定自驾车需要多少传感器涵盖传感区域。
3D 环境区分静态和动态物体的能力。
更新率,决定传感器资讯更新的频率。
不同环境条件下的总体可靠性和准确性。
成本、大小和软件相容性。
生成资料量。
以下是特斯拉、Volvo-Uber、Waymo 的传感器方案示意图:
另外,关于无源传感器和有源传感器,报告也详尽介绍:
无源传感器
无源传感器能探测环境物体反射的现有能量,如光、辐射等。但在弱光环境下,由于自己
没有传递源,无源传感器的效能将会下降。并在产生资料方面,比起有源传感器,无源感
测器产生的资料量更多,约 0.5~3.5Gbps。
即便如此,无源传感器仍有许多特点:
涵盖整个视野宽度的高分辨率画素和色彩。
视野保持恒定帧频。
两个镜头可生成一个 3D 立体检视。
缺乏发射源,减少其他车辆干扰的可能性。
技术成熟,成本低。
系统生成的影像便于用户理解互动。
如果在自驾车使用无源镜头传感器套件,需要涵盖汽车周围环境。这可透过使用特定时间
间隔拍摄影像的旋转相机做到,或用软件将 4~6 台相机影像接在一起。
此外,这些传感器需要超过 100 分贝的高动态范围(场景高光和阴影成像能力),能在
各种光照条件下工作,并区分不同物体。
有源传感器
有源传感器有讯号传送源,依靠 TOF 原理传感环境,ToF 能透过等待讯号反射传回测量
讯号从源头到目标的传递时间,讯号频率决定系统使用的能量及准确性。因此,确定正确
的波长在选择系统时是关键。
关于有源传感器种类,报告主要介绍 3 种:
超音波传感器:也称为声纳、声音导航测距。在有源传感器中,音波频率最低(波长最长
),因此更容易被干扰,这也意味着超音波传感器很容易受不利环境条件影响,如下雨和
灰尘。另外,其他音波产生的干扰也会影响传感器效能,需要透过使用多传感器和依赖其
他种类传感器来缓解干扰。
雷达:主要以无线电波测距。无线电波以光速传递,电磁波谱中频率最低(波长最长),
基于无线电波反射特徴,雷达传感器可探测到前方物体以外的东西。
不过,雷达讯号容易被具相当导电性的材料(如金属物体)反射,并其他无线电波干扰也
会影响雷达效能,造成雷达传感器无法探测。确定探测目标的形状这点,雷达的能力不如
光学雷达。
光学雷达:以脉冲光学形式使用光。光学雷达传感器以每秒 50,000~200,000 脉冲的速度
扫描一个区域,并将传回讯号编译成 3D 点云图,透过比对连续传感的点云图、物体差异
侦测运动,建立 250 公尺范围的 3D 地图。
规划
根据自驾车传感器套件撷取的初始资料和已有地图,自动驾驶系统需要同时定位和对映演
算法构建和更新具体环境地图,追踪具体定位,开始规划从一点到另一点的路径。
SLAM 与传感器融合
SLAM 是复杂的过程,因定位需要地图,而绘制地图需要良好的位置估算。为了更准确执
行即时定位和地图构建,传感器融合开始发挥作用。
传感器融合是将多传感器和数据库结合,以改进资讯的过程,是多层次任务,能处理资料
间的联系和相关性组合资料,与使用单资料源相比,能获得更便宜、更高品质、相关性更
高的资讯。
自驾车 AI 架构主要有两种方法:
逐步处理。把整个驾驶过程拆解为一系列逐层连线的流水线,其中每一步,如传感、定位
、地图、路径导航、运动控制,都分别由各自软件套件处理。
端到端。基于深度学习的解决方案,一次性处理所有功能。
透过传感器融合,自驾车获得资料,不过如何从传感器讯号撷取有用的资讯,并基于现有
资讯执行,需要利用机器学习算法──CNN、RNN、DRL。
CNN(卷积神经网络):主要用于处理影像和空间资讯,撷取感兴趣的特征和辨识环境物
体。神经网络是由一个卷积层构成:一个过滤器集合,尝试区分影像元素或输入资料做好
标记。卷积层汇出输入到算法,算法结合资讯预测影像的最佳说明。最后的软件通常
称为物体分类器,因可分类影像里的物体,如交通号志或另一辆车。
RNN(递回神经网络):主要用于处理影片资讯,先前步骤汇出将输入网络,允许资讯和
知识在网络持久存在并内化。
DRL(深度强化学习):DRL 允许软件定义的“代理”学习在虚拟环境使用奖励函数,达
成目标最佳操作。这些针对目标的算法将学习如何达成目标,或如何在多步骤下沿着特
定角度最大化。目前,深度强化学习在自驾车的应用还处在起步阶段。
这些方法不一定独立存在。为了避免过度拟合,深度学习通常会多工训练网络。当机器学
习算法训练用于特定工作时,它会变得非常专注模仿训练的数据,以至于尝试插值或外
推时,结果会不太现实。
透过多工训练机器学习算法,网络核心将专注发现所有目的都有用的通用特徴,而不是
专注于一个工作,以便输出更实际有用的应用程式。
利用传感器的所有资料和算法,自驾车能探测周围物体。接下来,它需要找到一条路。
路径规划
车辆了解环境物体及位置后,可使用 voronoi 图(车辆与物体间的最大距离)、使用网
格算法或驾驶廊道算法,确定车辆的大范围路径。然而,这些传统方法无法满足车辆
于动态环境行动。
报告指出,部分自驾车不仅依靠机器学习算法传感环境,还依靠这些资料来控制车子。
路径规划可透过模仿学习传授给 CNN,CNN 会尝试模仿驾驶的行为。
通常情况下,这些机器学习方法会与经典的运动规划和轨迹最佳化方法结合,以确保路径
的强健性。此外,出于其他目的(如减少燃料使用),车商还会在模型提供最佳路径参考
。
车辆执行过程的神经网络训练和推理需要巨大计算能力,由于汽车需及时回应新数据,因
此操作车辆所需部分处理需在车上进行,模型改进可在云端完成。
目前,机器学习的最新进展在有效处理自驾车传感器产生的资料,减少计算成本。此外,
芯片制造和微型化进步也提高可安装于自驾车的计算能力。随着网络协定进步,自驾车或
许能靠低延迟基于网络的资料处理,帮助自己自主操作。
执行
那么,车辆是如何行动的?
人类驾驶的车子,转向、刹车或讯号等动作通常由驾驶控制。驾驶的机械讯号由电子控制
单元(ECU)转换成驱动指令,再由电动或液压执行器执行。
(半)自驾车中,这种功能直接被与 ECU 通讯的驱动控制软件取代。这些软件能改变车
辆架构,减少零件数量;尤其是专门用于为 ECU 将机械讯号从驾驶转换为电讯号的零件
。
自驾车通常包含多个 ECU,一般约有 15~20 个,高阶车款可能达 100 个。
ECU 是简单的计算单元,有独立微控制器和内存,处理收到的输入资料,并转换为子系
统汇出指令,如转换自动变速箱。
一般来说,ECU 既可负责控制车辆操作,也能负责安全功能,执行资讯娱乐和应用程式。
并大多数 ECU 支援单应用程式,如电子动力转向,能在区域执行算法和处理传感器资
料。
挑战一:系统复杂性
工程师需要为系统设计正确的电子架构,以便融合传感器,将决策同步配置到按指令行事
的较低层子系统,这对需求的增加和复杂性提出挑战。
理论上,在一种极端情况下,人们可以选择完全分布式架构,每个传感单元处理初始资料
并与网络其他节点通讯。光谱另一端有个集中架构,所有远端控制单元(RCUs)都直接连
线到中央控制点,控制点收集所有资讯并执行传感器融合过程。
这范围中间是混合解决方案,将在更高抽象等级工作的中央单元与执行专属传感器处理,
或与执行决策算法区域结合。这些区域可基于车辆内部位置,如车子前或后部区域,控
制的功能类别,或处理的传感器类别(如照相机)。
在集中式体系架构,不同传感器的测量值是独立的,不受其他节点影响。资料在系统的边
缘节点没有修改或过滤,为传感器融合提供最大可能资讯,并具较低延迟。这架构的挑战
在大量资料需要传输到中央单元并处理,这需要强大的中央电脑,而且还要高频宽的重型
线束。
分布式架构可用更轻的电气系统达成,但更复杂。尽管在这样的架构,与频宽和集中处理
相关的需求大大减少,但驱动和传感阶段之间引入延迟,增加资料验证的挑战性。
挑战二:动力、热量、重量和体积增加
除了增加系统复杂性,自动化还会增加车辆零件的功耗、热足迹、重量和大小。无论架构
是分布式还集中式,autonomous 系统的功耗需求都很巨大,这之中主要的驱动因素是竞
争需求。
全自驾车的竞争需求比目前生产最先进的汽车高出近 100 倍。对纯电动车来说,行驶里
程容易受动力需求的负面影响。因此,Waymo 和福特等公司选择专注混动车,Uber 则使
用全汽油 SUV。然而专家指出,全电动最终会成为动力系统的选择,因内燃机在为车载电
脑发电方面效率不佳。
处理需求增加和更高功率吞吐量会使系统升温,但为了使电子元件正常可靠工作,不管车
外部条件如何,电子元件必须保持于一定温度范围内,这就需要冷却系统。但冷却系统会
增加车重和体积大小,特别是液体冷却。另外,其余套件、布线和热管理系统也会对车重
、体积和热效能造成压力。
自动驱动元件的供应商正改变产品,从减轻像 LIDARs 等大型元件重量,到构建
semiconductor 这类微型元件。同时,半导体公司也在制造占地面积更小、热效能更好、
干扰更小的元件,发展各种硅元件,如 MOSFET、bipo – lar 电晶体、二极管和积体电
路。
不仅如此还考虑使用新材料氮化镓(GaN)。与硅相比,氮化镓可更有效传导电子,在给
定的导通电阻和击穿电压下,制造出更小元件。
一辆全自驾车包含的程式码可能比迄今开发的任何软件平台或作业系统都多,要自行处理
所有算法和过程,需要显著的计算能力和强大的处理能力,目前 GPU 加速处理正成为
产业标准。
在 GPU 领域,Nvidia 是市场领导者。Nvidia 的竞争主要集中在张量处理单元(TPU)晶
片设计,加速深度学习算法核心的张量运算。另外,GPU 用于图形处理也阻止深度学习
算法充分利用芯片的能力。
可见,随着车辆自动化程度提高,车辆的软件形态将发生显著变化。除此之外,车子拥有
更多自主权,也会影响用户与车辆的互动方式。