ag体育平台_马斯克LiDAR无用论可能并非打嘴炮,研究表明立体视觉或能取代LiDAR

By admin in 科技 on 2021年12月31日

ag体育

【ag体育】在特斯拉最近的“自主日”上,特斯拉首席执行官埃隆穆斯克直言不讳地“抨击”了激光雷达技术的局限性。“太便宜,几乎不合适,傻子也不会用激光雷达”。马斯克有时候会吹嘴炮,我们习惯了,但这一次,他未必空穴来风。据Memes Consulting介绍,康奈尔大学最近的一项研究证明,廉价的立体视觉相机可以获得与激光雷达系统完全相同的精度,激光雷达是目前自动驾驶技术发展中最稀有、最廉价的方案。

在这项名为“基于视觉深度估计的伪激光雷达,增加了自动驾驶3D物体的观察间隙”的新研究成果中,研究人员解释了一种理解图像视觉系统数据的新技术。当输出通常用作处理激光雷达数据的算法时,这种新的数据理解技术大大提高了基于图像的物体观察精度。

就像俄罗斯卡车制造商KAM官方平台AZ的自驾卡车计划,以及TuSimple在其自驾卡车系统中给出的激光雷达、毫米波雷达和摄像系统一样,业界已经基本接受自驾车辆必须部署多种传感器系统。根据康奈尔大学的研究,立体相机系统至少可以获得低成本的备份系统,用于基于激光雷达的观测方案。研究人员指出,激光雷达和立体相机深度估计系统产生的点云质量没有差异。

然而,根据德国卡尔斯鲁厄理工学院和芝加哥丰田理工学院开发的KITTIVisionBenchmarkSuite,仅针对图像数据的算法无法构建10%的3D Averageprecision (AP),而激光雷达系统可以构建66%的3D Averageprecision。由视觉深度估计得到的伪激光雷达信号。

左上角:KITTI的街景,车辆周围有激光雷达(红色)和伪激光雷达(绿色)获得的超级边界板。左下角:估计深度图。右图:伪激光雷达(蓝色)与激光雷达(黄色)。

伪激光雷达点与激光雷达点非常一致。研究人员已经明确指出,这种基于图像的3D信息响应,而不是点云的质量,是激光雷达性能更好的原因。

ag体育

激光雷达信号显示为自上而下的视图,而基于图像的数据被解释为基于像素的正向方法,这会使远处对象的大小失真,从而随着距离的增加,使相机收集的数据的3D响应更加困难。康奈尔大学研究人员发现的解决方案是,将基于图像的立体视觉数据切换到类似于激光雷达分解的三维点云,然后将数据切换到“俯视”格式,然后将数据输出用作理解激光雷达数据的三维对象观察算法。

研究人员在实验中使用了40万像素的摄像头。虽然实验结果仍无法与激光雷达66%的3D平均精度相媲美,但使用该方案,基于图像数据的3D平均精度大大提高到37.9%。研究人员回应说,更高分辨率的相机可能会进一步改善实验结果。康奈尔大学的研究人员明确提出了一种基于图像的三维物体观察方案。

对于等效的立体或单目图像,首先预测和估计深度图,然后将其投影到激光雷达坐标系中的三维点云。研究人员称这个表达为伪激光雷达。

然后像激光雷达一样,可以应用于任何基于激光雷达的观测算法,扩展数据处理。根据康奈尔大学公布的研究,目前不可能大规模用立体摄像系统代替激光雷达,但将来可能在理论上不切实际。

研究人员进一步明确提出,如果汽车同时配备激光雷达和摄像机视觉系统,可以利用激光雷达数据训练专门用于在完全一致和连续的基础上解释3D图像数据的神经网络,从而提高摄像机视觉系统作为主激光雷达系统备份的准确性。定性比较。研究人员将AggregateViewObjectDetection(AVOD)与激光雷达、伪激光雷达和前立体视图进行了比较。

基本事实框是红色的,预测框是绿色的。正面立体视觉法(右)甚至错误的计算了附近物体的深度,几乎忽略了远处的物体。有时候,非常简单地找到它并不会产生最重要的影响。

在这项研究中,增加基于图像和基于激光雷达的3D物体观测之间的差距的关键是3D信息的表示。本质上,这一研究结果是对系统低效率的修正,而不是一种新的算法。然而,这并不意味着这个发现不是最重要的。

研究人员的研究结果与他们对卷积神经网络的解释完全一致,并得到了现代科学成果的检验。事实上,康奈尔大学的研究人员已经从这一修正案中做出了前所未有的改进,并对所有其他项目产生了一定程度的影响。随着这一巨大进步,基于图像的自主车辆三维物体观测可能在不久的将来成为现实。这一前景的影响是巨大的。

目前激光雷达硬件可以说是自动驾驶必备的最便宜的可选部件。如果能用于激光雷达,自动驾驶的硬件成本会大大增加。此外,即使对于配备激光雷达设备的自动驾驶汽车,基于图像的物体观察也是有希望的。

ag体育

一种可能的情况是,激光雷达数据可以用于连续训练和微调基于图像的3D对象识别。当激光雷达传感器经常出现故障时,基于图像的三维观测可以作为可靠性较低的备份系统。

另一种在一定程度上应用于装备激光雷达硬件的高端豪车等场景,其数据可以用于经济型车辆上基于图像的三维检测系统的连续训练。在未来的进一步研究中,这项研究还可以在许多必要的方向上进行探索。

首先,更高分辨率的立体图像可以显著提高远处物体的观察精度。目前的研究成果中仅使用了40万像素的相机,与最先进设备的相机光学技术相差甚远。其次,在本研究中,动态图像处理并没有受到重视,对一幅图像中所有物体的分类都是一秒左右,未来可能会将识别速度提高几个数量级。

最近对动态多分辨率深度估计的研究进展指出,加速深度估计的一个有效方法是首先在低分辨率下计算深度图,然后融合高分辨率来优化先前的结果。从深度图到伪激光雷达图的切换非常慢,因此应该可以通过使用模型蒸馏或任意时间预测等技术来大大降低观察速度。

此外,通过激光雷达和伪激光雷达的传感器融合,未来的研究可以进一步提高三维物体观测的技术水平。伪激光雷达的优点是信号比激光雷达密集得多,两种数据模式可以有很强的互补性。

这一研究成果将在未来反对和兴起基于图像的三维物体识别技术,或将促进计算机视觉领域的发展,并在不久的将来几乎避免图像方案与激光雷达之间的性能差距。:ag体育。

本文来源:ag体育-www.masbsdy.com

Comments are closed.

网站地图xml地图
Copyright @ 2010-2022 ag体育|官方平台 版权所有