原文标题:
深度传感技术实现3D机器视觉 (请勿删减原文标题)
原文连结:
https://reurl.cc/Gmv6op (请善用缩网址工具)
发布时间:
2021-07-20
作者 : Anne-Françoise Pelé,EE Times欧洲版主编
(请以原文网页/报纸之发布时间为准)
原文内容:
什么是人类视觉能做到而电脑视觉所不能的?人类从三个维度感知世界,而深度传感器是
实现更高等级机器视觉、解锁自动驾驶功能的关键。
在传感技术最新发展的助力之下,越来越多的机器被赋予了感知、行动及与环境互动的能
力;为此,《EE Times》欧洲版团队探索了当前3D视觉技术领域,以期更清晰地了解其市
场驱动力以及零组件供应商面临的机遇和挑战,还有可支援更高等级深度敏感度的新兴技
术。
https://www.eettaiwan.com/wp-content/uploads/sites/5/2021/07/3DsensorP1.png
Yole预期车用3D传感技术市场规模将在未来五年内成长四倍。
往更高深度发展
根据市场研究机构Yole Développement的统计数字,在模组层面,3D传感市场目前市值
为68亿美元,将以15%的复合年成长率(CAGR)在2026年达到150亿美元规模。
Yole Développement光学和传感部门首席分析师Pierre Cambou接受《EE Times》欧洲版
访问时表示:“因为华为(Huawei)禁令以及Android阵营事实上放弃了3D传感技术,扮演
主要市场驱动力的手机与消费性电子市场的成长出现暂时性中断;”他补充指出,在另一
方面,“由于Apple在iPad和iPhone添加光达(LiDAR)传感器,又加速了此一趋势。”
3D传感在汽车领域的应用也在加速。LiDAR传感器和座舱内3D摄影机越来越多地被采用,
“我们对汽车市场的 3D 传感发展非常乐观,该市场规模在未来五年应能成长四倍。”
目前较流行的3D成像技术包括立体视觉(stereo vision)、结构光(structured light)和
飞行时间(ToF)。Cambou指出,立体视觉在10公尺以外的远距离传感应用中表现极佳,例
如大疆(DJI)等业者的消费性无人机,以及Mercedes、Jaguar和Subaru等车厂在某些车款
采用的前向ADAS 摄影机。
结构光技术则一直是1公尺内短距离传感的首选方案,经典应用案例如iPhone将其用于前
向Face ID脸部辨识功能;该技术也被导入某些工业应用,获得Photoneo等公司采用。至
于TOF,Cambou表示该类系统主要用于中距离,目前主要有两种方法;一是间接
(indirect) ToF,获得华为、三星(Samsung)与LG等手机应用于2019 和2020年款式的
Android手机后向摄影机,主要用于拍照。
还有另一种直接ToF,已导入Apple最新款iPhone;Cambou指出:“直接ToF是LiDAR 中已
经采用的技术(例如Velodyne、Innoviz、Ibeo、Hesai和RoboSense等公司的产品),但最
终可能会在接收侧使用矩阵形式传感器。由于来自自动驾驶的激励,这类传感器正在取得
进展。”
EELs还是VCSELs?
LiDAR撷取整个场景的能力,使该技术在机器视觉应用中极具价值;取得3D点云最常用的
两种系统为Flash LiDAR和扫描式(scanning) LiDAR。
ams Osram全球行销经理Matthias Hoenig表示,在扫描式LiDAR系统中,聚焦脉冲雷射光
束透过机械旋转反射镜或微机电系统(MEMS)反射镜定向到某个特定的小立体角(solid
angle)。由于高功率雷射光束可以被控制发射在很小的立体角,因此与使用3D Flash系统
可达到的距离相比,使用光学功率元件可达到的距离要远得多。
Hoenig指出:“边射型雷射(Edge-emitting lasers,EEL)是这类系统架构的理想选择,
因为是透过一个很小的发射区域在极小空间内提供大量的光线,在功耗和距离方面都表现
出色。”现在已成为ams子公司的Osram表示,随着封装温度在应用过程中上升,其雷射器
在波导稳定性方面最近取得了不少进展,该公司目前正在探索针对LiDAR 应用的具有更高
波长产品。
Yole 预测,就雷射二极管而言,EEL目前的市场机会最大,但垂直共振腔面射型雷射
(VCSEL) 将会在未来迅速赶上。VCSEL结合了红外线LED的高功率密度、封装简单优点,以
及雷射的光谱宽度与速度。
“这项技术的优势包括出色的光束品质、简单的设计和小尺寸,这也解释了VCSEL市场成
长的原因;”Hoenig表示:“通常来说,虽然在某种程度上它们需要的占位空间会比EEL
发射器更多,但在某些应用领域又具有优势。”
他解释,例如,VCSEL所具有的辐射特性使其特别适用于Flash LiDAR系统以及工业应用─
─如机器人、物流车辆等──的主动立体视觉。至于VCSEL相关的技术挑战,Hoenig表示
,ams Osram正在研究更高的光输出。
在2018年收购Vixar之后,Osram陆续展示了比单接面(single-junction) VCSEL效率更高
、速度更快的双接面与三接面VCSEL技术。在2021年的美国Photonics West展会上,ams
Osram又推出了基于多接面技术的PowerBoost VCSEL 产品系列;该公司表示,他们还在探
索改善散热的各种方法,例如,从顶部发射元件改为底部发射元件。
ams Osram资深行销经理Lei Tu表示,所有常见的3D传感方法都仰赖各个系统功能区块之
间的顺畅互动。通常这些系统由光源、专用光学元件、探测器,和处理探测讯号之下游软
体(downstream software)组成。
她接着指出,在未来,“对ams Osram这样的元件制造商来说,重点将是以可行的最佳方
式满足客户的需求,包括元件的小型化,以及光学性能和使用寿命的最佳化,当然还有易
用性。” Tu补充,有些客户喜欢“现成的随插即用解决方案,”另一些客户则更倾向于
自己动手组装单个元件,或透过协力厂商将它们组装成完整的解决方案。”
用于盲点侦测的深度和侧面传感
深度感知是指从三个维度“看”物体、并测量物体距离多远的能力。LiDAR无疑扮演了自
动驾驶车辆的眼睛,许多车厂都利用它来构建车辆周围的3D环景图。不过,相关技术开发
工作主要还是聚焦于在支援较长探测距离(200公尺以上)但视野相对狭窄(约20°~30°)的
前向LiDAR 系统。
一家在2019年自德国Fraunhofer硅技术研究所(Institute for Silicon Technology,
ISIT)独立出来的公司OQmented正在努力改变这种状况;该公司表示,他们已开发出一种
MEMS反射镜技术,可以使侧边LiDAR具有180°视野。
OQmented创办人兼董事总经理Ulrich Hofmann表示,“侧视LiDAR系统主要针对短距离盲
点侦测;”盲点侦测是一项重要的安全功能,它使短距离侧面扫瞄系统“比远视系统更具
意义。”举例来说,“在进入一个十字路口时,妳会需要这些LiDAR系统在短距离范围进
行观察,因为这种环境中的行人、自行车骑士和汽车都很多,很容易混乱并发生意外。”
“出于以上原因,不仅在需要有宽广角度的清晰视野,较高的横向分辨率也很重要,它可
以区分不同的物体,包括静态和移动的物体;”OQmented在其MEMS反射镜顶部以曲面玻璃
盖取代平面玻璃盖,让雷射光束成功传输到封装中,并实现180°雷射扫描。
Hofmann指出,该公司的专利Bubble MEMS技术不仅提供了“密封真空封装和保护,”避免
元件受环境污染物影响,还确保了雷射光束成功出入封装,因为雷射光束与玻璃的角度始
终垂直;当使用平面玻璃盖时,情况就并非总是如此理想,当扫描角度较大时,部分光线
会在盖子处反射回封装中,这对于任何类型的LiDAR解决方案都是不可接受的。
https://www.eettaiwan.com/wp-content/uploads/sites/5/2021/07/3DsensorP2.png
Bubble MEMS技术的命名源自于该MEMS反射镜上方的曲面玻璃盖。(来源:OQmented)
更接近资料来源
影像传感器会生成大量的资料,尽管目前大部分处理过程都在云端或中央处理单元完成,
但其发展趋势是使运算更接近资料来源,并将智慧元素嵌入传感器内部或附近。
Yole的Cambou表示,通常情况下,资料采用H.264技术压缩,这意味着它可以透过100Mbp
的频宽传输;“但在传感领域,资料流通常是10到100倍——典型机器视觉资料流可达到
1Gbps——而且,如果同时使用10个摄影机,则很快会达到10Gbps 甚至更高。”
由于CPU任务繁重,靠近传感器进行资料处理的必要性越来越高;如果需要,所有预处理
、清理和AI强化都必须在更靠近传感器的位置进行,以减轻CPU的负担;”但Cambou也指
出,目前还几乎没有运算能够在传感器本地进行,因为会产生热。
前景展望
影像传感器是实现自动驾驶的一个关键因素,却不能无限制地添加,因为所需要的运算能
力也会激增。对此Yole的分析师表示,有一种解决方案是提高资料品质;“但如果真的想
解决自动驾驶问题,我们很快就会需要更多样化的解决方案。”
https://www.eettaiwan.com/wp-content/uploads/sites/5/2021/07/3DsensorP3.png
影像传感器技术的创新历程。
(图片来源:Yole Développement)
新技术不断涌现,用以提高灵敏度并构建可以看得更清楚的机器。Cambou指出了两个方向
:一是神经形态感知(neuromorphic sensing),也就是每个像素都扮演神经元,并嵌入一
定程度的智慧;二是以及量子成像,即单独侦测每个光子。
总部位于法国的神经形态新创公司Prophesee推出了基于事件(event-based)的工业级视觉
传感器──第三代Metavision传感器。该公司产品行销暨创新总监Simone Lavizzari表示
:“如果Metavision传感器与VCSEL投射器或其他可以投射适当图案的投射器结合使用,
就可以实现基于事件的结构光传感器;”也就是说,当今最先进的深度传感技术在曝光时
间、精确度和耐用性之间取得了平衡。
Lavizzari表示,将红外线(IR)投射器与Prophesee的Metavision传感器结合,可为每个独
立像素提供快速反应时间,进而允许直接在传感器内部进行时间模式识别和提取;“如果
采用基于事件的传感器来做结构光,反应会非常快。我们可以将扫描时间提高50倍,只需
1毫秒(millisecond)就能获得完整的3D扫描,而传统基于影格(frame-based)方法则需要
10~33毫秒。”
基于事件的传感器也具备先进的精确度,而且“软件复杂度已降至最低,因为不需要在后
处理中进行匹配(matching);”Lavizzari指出,匹配不是在事件发生后在影格上完成,
而是在传感器层级逐个像素完成,这其中一个优势是,“它没有运动模糊,因为可以非常
快速地截取点云,而且相容于户外应用相容。” 超快脉冲侦测不仅可以提高功率,还能
保持该技术的人眼安全等级。
在量子成像方面,Cambou 提到了Gigajot Technology的Quanta Image Sensors (QIS),
这是一款具有光子计数(photon-counting)能力的单光子影像传感器。Gigajot是一家总部
位于美国加州的新创公司,声称能以每像素/影格1个光子的等级,从一个个影格中重建动
态场景。
责编:Judith Cheng;本文同步刊登于EE Times Taiwan Digital数位板杂志2021年7月号
(参考原文 :Depth Sensing Takes Machine Vision into Another Dimension ,By
Anne-Françoise Pelé)
心得/评论: ※必需填写满20字
看起来重点在光达技术(LiDAR)还有运算处理器,台厂有可能吃到这市场吗?