Echo

关注TA

大家好，我是Echo！

普罗旺斯
自由职业
写了308,471,302字

该文章投稿至Nemo社区资讯板块复制链接

百度论文研究：单目摄像头实时感知车辆形状，显著提高 3D 目标检测性能

发布于 2021/09/04 17:21 354浏览 0回复 1,277字

通常，自动驾驶汽车通过单目摄像头看到的世界长这个样子：

百度论文研究：单目摄像头实时感知车辆形状，显著提高 3D 目标检测性能

马路上的其他车辆、物体，都被统一建模成一个个立方体，具体的结构细节则被忽略。

想要更精准地勾勒出车辆的真实形态，当然也不是不行，但那就需要用上激光雷达、双目相机等更加昂贵的传感器。

不过现在，一项最新研究赋予了单目摄像头新的能力 ——

百度论文研究：单目摄像头实时感知车辆形状，显著提高 3D 目标检测性能

是的，仅凭单目相机，就能实时感知物体的 3D 形状，进而提高 3D 目标检测性能。

这项研究来自百度，论文已经入选 ICCV 2021。

考虑 2D/3D 形状感知约束的 3D 检测框架

具体如何实现？

大体上可以分为三步：

首先，引入 CAD 模型，在 CAD 模型上预先定义几个不同的 3D 关键点。
然后利用深度学习网络，来建立 3D 关键点和它们在图像上的 2D 投影之间的关联。
最后，利用这样的对应关系为每个目标物体建立 2D/3D 约束。

百度论文研究：单目摄像头实时感知车辆形状，显著提高 3D 目标检测性能

整体的网络架构如上图所示，8 个分支头分别对应中心点分类、中心点偏移、2D 关键点、3D 坐标、关键点置信度、物体方向、维度，以及 3D 检测置信度得分。所有回归信息最后都会被用来恢复物体在摄像机坐标中的 3D 边界框。

而为了自动生成 2D/3D 关键点的真实标注，研究人员还提出了一种自动模型拟合方法。也就是根据摄像头观测到的 2D 图像，自动拟合不同的 3D 物体模型和物体掩码。

百度论文研究：单目摄像头实时感知车辆形状，显著提高 3D 目标检测性能

具体而言，该方法是基于不同种类的车辆 CAD 模型，以及 KITTI 数据集中的 3D 物体样本实现的。

研究人员指出，实际上，3D 形状标注的过程可以看作一个优化问题，其目的是计算出最佳参数组合，来适应 AI 通过“视觉观察”得到的结果（如 2D 物体掩码、3D 边界框、3D 点云等）。

百度论文研究：单目摄像头实时感知车辆形状，显著提高 3D 目标检测性能

实验结果

研究人员在 KITTI 3D 目标检测基准上测试了这一新方法的性能。

KITTI 3D 目标检测基准包含 7481 张训练图像、7518 张测试图像，以及对应的点云，总共包括 80256 个标记对象。

在这项研究中，由于测试集的真实数据不可用，研究人员将训练数据分为训练集（3712 个样本）和验证集（3769 个样本），用以完善模型。

另外，用以测试的模型是在 2 块英伟达 V100 上训练完成的，批量大小设为 16。

百度论文研究：单目摄像头实时感知车辆形状，显著提高 3D 目标检测性能

△红色代表最佳结果，蓝色代表次佳结果

可以看到，在全部 6 个任务中，采用了 48 个关键点的 AutoShape 方法取得了 4 项第一。而采用 16 个关键点的 AutoShape 速度更快，准确性损失也并不大。

百度论文研究：单目摄像头实时感知车辆形状，显著提高 3D 目标检测性能

此外，从上图中可以看出，模型预测的 3D 形状与真实物体一致性较高。

百度论文研究：单目摄像头实时感知车辆形状，显著提高 3D 目标检测性能

即使是画面中位置较远的车辆、被截断/遮挡的物体，其位置也能被准确检测到。

总而言之，相比于其他现有方法，AutoShape 更准确，并且推理速度更快，可以达到 25FPS 的处理速度，也就是说可以实现实时检测的效果。

论文地址：

https://arxiv.org/abs/2108.11127

项目地址：

https://github.com/zongdai/AutoShape

本文由LinkNemo爬虫[Echo]采集自[https://www.ithome.com/0/573/449.htm]

本文标签
百度汽车摄像头自动驾驶

上一个文章：打一把游戏看一场病，VR 比平板电脑更能减轻疼痛

下一个文章：俄宇航员完成 8 小时出舱任务，连接国际空间站电源线

点了个评

Echo

百度论文研究：单目摄像头实时感知车辆形状，显著提高 3D 目标检测性能

考虑 2D/3D 形状感知约束的 3D 检测框架

实验结果

最新文章

奇瑞星途星纪元 ET 增程四驱版开启预售，24.98 万元起

东风日产纯电轿车 N7 发布：搭载高通骁龙 8295p 芯片、momenta 高阶智驾

天舟八号货运飞船将择机实施发射，长征七号火箭准备就绪

退订要收费，美国联邦贸易委员会计划调查微软 Azure 云业务

2025 款广汽丰田铂智 4X 纯电 SUV 上市：标配智驾、8 气囊，车机升级 8155 芯片，17.98 万元起

民航局发布民用无人驾驶航空器飞行动态数据报送要求

微信海外版 WeChat 在苹果 iOS 端上线通行密钥，无需密码即可登录

深蓝航天明年将启动“筷子夹火箭”试验

国家级法律 AI 基座模型发布：可大大降低公共法律服务门槛

大疆农业 2025 新品发布会定档 11 月 25 日，将推“十二年超越之作”