[新闻] 深度传感技术实现3D机器视觉 hedgehogs PTT批踢踢实业坊

[新闻] 深度传感技术实现3D机器视觉

楼主: hedgehogs (刺猬) 2021-07-26 17:31:04

原文标题：
深度传感技术实现3D机器视觉 (请勿删减原文标题)
原文连结：
https://reurl.cc/Gmv6op (请善用缩网址工具)
发布时间：
2021-07-20
作者 : Anne-Françoise Pelé，EE Times欧洲版主编
(请以原文网页/报纸之发布时间为准)
原文内容：
什么是人类视觉能做到而电脑视觉所不能的？人类从三个维度感知世界，而深度传感器是
实现更高等级机器视觉、解锁自动驾驶功能的关键。
在传感技术最新发展的助力之下，越来越多的机器被赋予了感知、行动及与环境互动的能
力；为此，《EE Times》欧洲版团队探索了当前3D视觉技术领域，以期更清晰地了解其市
场驱动力以及零组件供应商面临的机遇和挑战，还有可支援更高等级深度敏感度的新兴技
术。
https://www.eettaiwan.com/wp-content/uploads/sites/5/2021/07/3DsensorP1.png
Yole预期车用3D传感技术市场规模将在未来五年内成长四倍。
往更高深度发展
根据市场研究机构Yole Développement的统计数字，在模组层面，3D传感市场目前市值
为68亿美元，将以15%的复合年成长率(CAGR)在2026年达到150亿美元规模。
Yole Développement光学和传感部门首席分析师Pierre Cambou接受《EE Times》欧洲版
访问时表示：“因为华为(Huawei)禁令以及Android阵营事实上放弃了3D传感技术，扮演
主要市场驱动力的手机与消费性电子市场的成长出现暂时性中断；”他补充指出，在另一
方面，“由于Apple在iPad和iPhone添加光达(LiDAR)传感器，又加速了此一趋势。”
3D传感在汽车领域的应用也在加速。LiDAR传感器和座舱内3D摄影机越来越多地被采用，
“我们对汽车市场的 3D 传感发展非常乐观，该市场规模在未来五年应能成长四倍。”
目前较流行的3D成像技术包括立体视觉(stereo vision)、结构光(structured light)和
飞行时间(ToF)。Cambou指出，立体视觉在10公尺以外的远距离传感应用中表现极佳，例
如大疆(DJI)等业者的消费性无人机，以及Mercedes、Jaguar和Subaru等车厂在某些车款
采用的前向ADAS 摄影机。
结构光技术则一直是1公尺内短距离传感的首选方案，经典应用案例如iPhone将其用于前
向Face ID脸部辨识功能；该技术也被导入某些工业应用，获得Photoneo等公司采用。至
于TOF，Cambou表示该类系统主要用于中距离，目前主要有两种方法；一是间接
(indirect) ToF，获得华为、三星(Samsung)与LG等手机应用于2019 和2020年款式的
Android手机后向摄影机，主要用于拍照。
还有另一种直接ToF，已导入Apple最新款iPhone；Cambou指出：“直接ToF是LiDAR 中已
经采用的技术(例如Velodyne、Innoviz、Ibeo、Hesai和RoboSense等公司的产品)，但最
终可能会在接收侧使用矩阵形式传感器。由于来自自动驾驶的激励，这类传感器正在取得
进展。”
EELs还是VCSELs？
LiDAR撷取整个场景的能力，使该技术在机器视觉应用中极具价值；取得3D点云最常用的
两种系统为Flash LiDAR和扫描式(scanning) LiDAR。
ams Osram全球行销经理Matthias Hoenig表示，在扫描式LiDAR系统中，聚焦脉冲雷射光
束透过机械旋转反射镜或微机电系统(MEMS)反射镜定向到某个特定的小立体角(solid
angle)。由于高功率雷射光束可以被控制发射在很小的立体角，因此与使用3D Flash系统
可达到的距离相比，使用光学功率元件可达到的距离要远得多。
Hoenig指出：“边射型雷射(Edge-emitting lasers，EEL)是这类系统架构的理想选择，
因为是透过一个很小的发射区域在极小空间内提供大量的光线，在功耗和距离方面都表现
出色。”现在已成为ams子公司的Osram表示，随着封装温度在应用过程中上升，其雷射器
在波导稳定性方面最近取得了不少进展，该公司目前正在探索针对LiDAR 应用的具有更高
波长产品。
Yole 预测，就雷射二极管而言，EEL目前的市场机会最大，但垂直共振腔面射型雷射
(VCSEL) 将会在未来迅速赶上。VCSEL结合了红外线LED的高功率密度、封装简单优点，以
及雷射的光谱宽度与速度。
“这项技术的优势包括出色的光束品质、简单的设计和小尺寸，这也解释了VCSEL市场成
长的原因；”Hoenig表示：“通常来说，虽然在某种程度上它们需要的占位空间会比EEL
发射器更多，但在某些应用领域又具有优势。”
他解释，例如，VCSEL所具有的辐射特性使其特别适用于Flash LiDAR系统以及工业应用─
─如机器人、物流车辆等──的主动立体视觉。至于VCSEL相关的技术挑战，Hoenig表示
，ams Osram正在研究更高的光输出。
在2018年收购Vixar之后，Osram陆续展示了比单接面(single-junction) VCSEL效率更高
、速度更快的双接面与三接面VCSEL技术。在2021年的美国Photonics West展会上，ams
Osram又推出了基于多接面技术的PowerBoost VCSEL 产品系列；该公司表示，他们还在探
索改善散热的各种方法，例如，从顶部发射元件改为底部发射元件。
ams Osram资深行销经理Lei Tu表示，所有常见的3D传感方法都仰赖各个系统功能区块之
间的顺畅互动。通常这些系统由光源、专用光学元件、探测器，和处理探测讯号之下游软
体(downstream software)组成。
她接着指出，在未来，“对ams Osram这样的元件制造商来说，重点将是以可行的最佳方
式满足客户的需求，包括元件的小型化，以及光学性能和使用寿命的最佳化，当然还有易
用性。” Tu补充，有些客户喜欢“现成的随插即用解决方案，”另一些客户则更倾向于
自己动手组装单个元件，或透过协力厂商将它们组装成完整的解决方案。”
用于盲点侦测的深度和侧面传感
深度感知是指从三个维度“看”物体、并测量物体距离多远的能力。LiDAR无疑扮演了自
动驾驶车辆的眼睛，许多车厂都利用它来构建车辆周围的3D环景图。不过，相关技术开发
工作主要还是聚焦于在支援较长探测距离(200公尺以上)但视野相对狭窄(约20°~30°)的
前向LiDAR 系统。
一家在2019年自德国Fraunhofer硅技术研究所(Institute for Silicon Technology，
ISIT)独立出来的公司OQmented正在努力改变这种状况；该公司表示，他们已开发出一种
MEMS反射镜技术，可以使侧边LiDAR具有180°视野。
OQmented创办人兼董事总经理Ulrich Hofmann表示，“侧视LiDAR系统主要针对短距离盲
点侦测；”盲点侦测是一项重要的安全功能，它使短距离侧面扫瞄系统“比远视系统更具
意义。”举例来说，“在进入一个十字路口时，妳会需要这些LiDAR系统在短距离范围进
行观察，因为这种环境中的行人、自行车骑士和汽车都很多，很容易混乱并发生意外。”
“出于以上原因，不仅在需要有宽广角度的清晰视野，较高的横向分辨率也很重要，它可
以区分不同的物体，包括静态和移动的物体；”OQmented在其MEMS反射镜顶部以曲面玻璃
盖取代平面玻璃盖，让雷射光束成功传输到封装中，并实现180°雷射扫描。
Hofmann指出，该公司的专利Bubble MEMS技术不仅提供了“密封真空封装和保护，”避免
元件受环境污染物影响，还确保了雷射光束成功出入封装，因为雷射光束与玻璃的角度始
终垂直；当使用平面玻璃盖时，情况就并非总是如此理想，当扫描角度较大时，部分光线
会在盖子处反射回封装中，这对于任何类型的LiDAR解决方案都是不可接受的。
https://www.eettaiwan.com/wp-content/uploads/sites/5/2021/07/3DsensorP2.png
Bubble MEMS技术的命名源自于该MEMS反射镜上方的曲面玻璃盖。（来源：OQmented）
更接近资料来源
影像传感器会生成大量的资料，尽管目前大部分处理过程都在云端或中央处理单元完成，
但其发展趋势是使运算更接近资料来源，并将智慧元素嵌入传感器内部或附近。
Yole的Cambou表示，通常情况下，资料采用H.264技术压缩，这意味着它可以透过100Mbp
的频宽传输；“但在传感领域，资料流通常是10到100倍——典型机器视觉资料流可达到
1Gbps——而且，如果同时使用10个摄影机，则很快会达到10Gbps 甚至更高。”
由于CPU任务繁重，靠近传感器进行资料处理的必要性越来越高；如果需要，所有预处理
、清理和AI强化都必须在更靠近传感器的位置进行，以减轻CPU的负担；”但Cambou也指
出，目前还几乎没有运算能够在传感器本地进行，因为会产生热。
前景展望
影像传感器是实现自动驾驶的一个关键因素，却不能无限制地添加，因为所需要的运算能
力也会激增。对此Yole的分析师表示，有一种解决方案是提高资料品质；“但如果真的想
解决自动驾驶问题，我们很快就会需要更多样化的解决方案。”
https://www.eettaiwan.com/wp-content/uploads/sites/5/2021/07/3DsensorP3.png
影像传感器技术的创新历程。
(图片来源：Yole Développement)
新技术不断涌现，用以提高灵敏度并构建可以看得更清楚的机器。Cambou指出了两个方向
：一是神经形态感知(neuromorphic sensing)，也就是每个像素都扮演神经元，并嵌入一
定程度的智慧；二是以及量子成像，即单独侦测每个光子。
总部位于法国的神经形态新创公司Prophesee推出了基于事件(event-based)的工业级视觉
传感器──第三代Metavision传感器。该公司产品行销暨创新总监Simone Lavizzari表示
：“如果Metavision传感器与VCSEL投射器或其他可以投射适当图案的投射器结合使用，
就可以实现基于事件的结构光传感器；”也就是说，当今最先进的深度传感技术在曝光时
间、精确度和耐用性之间取得了平衡。
Lavizzari表示，将红外线(IR)投射器与Prophesee的Metavision传感器结合，可为每个独
立像素提供快速反应时间，进而允许直接在传感器内部进行时间模式识别和提取；“如果
采用基于事件的传感器来做结构光，反应会非常快。我们可以将扫描时间提高50倍，只需
1毫秒(millisecond)就能获得完整的3D扫描，而传统基于影格(frame-based)方法则需要
10~33毫秒。”
基于事件的传感器也具备先进的精确度，而且“软件复杂度已降至最低，因为不需要在后
处理中进行匹配(matching)；”Lavizzari指出，匹配不是在事件发生后在影格上完成，
而是在传感器层级逐个像素完成，这其中一个优势是，“它没有运动模糊，因为可以非常
快速地截取点云，而且相容于户外应用相容。” 超快脉冲侦测不仅可以提高功率，还能
保持该技术的人眼安全等级。
在量子成像方面，Cambou 提到了Gigajot Technology的Quanta Image Sensors (QIS)，
这是一款具有光子计数(photon-counting)能力的单光子影像传感器。Gigajot是一家总部
位于美国加州的新创公司，声称能以每像素/影格1个光子的等级，从一个个影格中重建动
态场景。
责编：Judith Cheng；本文同步刊登于EE Times Taiwan Digital数位板杂志2021年7月号
(参考原文：Depth Sensing Takes Machine Vision into Another Dimension ，By
Anne-Françoise Pelé）
心得/评论： ※必需填写满20字
看起来重点在光达技术(LiDAR)还有运算处理器，台厂有可能吃到这市场吗？

继续阅读

Re: [请益] 在家全职操盘是什么感觉呀S9125126 [情报] 3504 扬明光上半年度合并财务报告a52655 [请益] 航运高点没出的水手们目标价是多少behati [新闻] 盛群Q2每股大赚2.26元ulong Re: [请益] 元大券商一直讲错交易规则，新手该何去blargelp [请益] 台美股定期定额券商选择lercon [情报] 2401 凌阳 5月自结0.08MOMO0478 [新闻] 生技ETF资金涌进绩效亮眼nab7772001 [请益] 元大券商一直讲错交易规则，新手该何去lemoncdream [新闻] 杜康-DR下市把台湾人当韭菜？证期局：四village0817