自动驾驶汽车如何识别悬空物体?

科技时尚 2026-04-02 chy123 4937

[首发于智驾最前沿微信公众号]不知道大家是否遇到过被风吹歪的树、斜插在路中央的路灯杆,或者一簇从路边低垂下来的茂密树枝这类的场景。对于人类驾驶员来说,一眼就能看出这些物体是否会挡住去路,但对于完全依赖传感器自动驾驶汽车而言,识别这些空间中的悬空物体却是一个极其复杂的过程。

这些物体不与地面直接相连,或者其主体部分位于传感器常规扫描范围的边缘,很容易被算法误认为是背景噪声或者是可以安全通过的虚警信号。那自动驾驶汽车是如何识别悬空物体的?

wKgZO2nNwGeAPTitAAAQo00DEvw799.jpg

激光雷达的避障原理

激光雷达作为自动驾驶汽车的“深度眼睛”,是识别悬空物体最得力的工具。其通过不断发射激光脉冲,并计算这些脉冲碰到物体后返回的时间,可以精准地测算出物体与车之间的距离。

当成千上万个激光点打在周围环境上时,系统就能获得一个密集的“点云图”。不同于普通照片的扁平,点云图是三维的,它记录了每一个点在空间中的确切坐标,包括高度信息。这意味着,当激光打在横跨道路的树枝或歪斜的灯杆上时,系统能立刻感知到这些物体的几何轮廓和它们距离地面的高度。

在实际行驶过程中,系统首先要解决的是“如何把地面撇开”的问题。激光雷达采集到的数据极其庞大,其中绝大部分是平坦的路面。为了让悬空物体显现出来,系统会运行“地面过滤”的算法。

这种算法会分析点云的垂直高度差异,将符合地面特征的点云去除,剩下的就是那些凸起于地面的障碍物。对于像树枝这样形状不规则的物体,系统会利用多帧点云叠加的技术,通过车辆在行驶过程中的位置移动,从多个角度给物体“拍照”,从而拼凑出它在空中的准确形状和体积。

图片源自:网络

除了形状,激光雷达还可以“反射强度”。不同材质的物体对激光的反射效率是不一样的。路灯杆是金属材质,它的反射率非常高且稳定;而树叶含有水分,表面粗糙,反射回来的信号则相对杂乱且微弱。

通过分析反射强度的差异,自动驾驶系统可以初步判断前面的障碍物到底是不可触碰的金属杆,还是可以轻微擦碰的软树叶。对于那些极细的树枝,虽然单个激光点可能难以捕捉到完整的轮廓,但通过如随机采样一致性方法等特殊的线段拟合算法,系统能够从零散的干扰点中识别出具有一定直径和长度的线性结构,从而预判出那是树木的延伸。

当然,激光雷达也有它的局限性。随着探测距离的增加,激光点会变得越来越稀疏。一个远处的路灯杆可能只被一个激光点扫到,这给判断带来了难度。

但自动驾驶汽车通常会将激光雷达安装在车顶的最高处,通过向下倾斜的扫描角度,确保对车辆前方的上方空间实现全覆盖。

通过这种俯瞰视角,车辆可以在进入危险区域之前的几百米外,就通过稀疏的点云预警到上方可能存在的高度障碍。

wKgZO2nNwGmATu4eAAAR42n7O-I911.jpg

毫米波雷达的避障原理

毫米波雷达通过发射无线电波来探测物体的速度和距离,而且它几乎不受大雨、浓雾或黑夜的影响。然而,传统的毫米波雷达缺乏“俯仰角”的分辨力。

简单来说,它能感觉到前面有个东西,但它很难分清楚这个东西是停在路面上的一辆坏车,还是悬在半空中的一块交通指示牌。

这种高度感知能力的缺失,曾经导致过很多自动驾驶系统的“幽灵刹车”事故,也就是车子突然对着空无一物的路面或者高处的路牌猛踩刹车的原因。

为了攻克这个难题,4D成像雷达技术应运而生。这里的“4D”指的是在原有的距离、速度、方位角基础上,增加了第四个维度,即高度。通过引入更多数量的天线阵列和更先进的数字信号处理算法,4D成像雷达能够像激光雷达一样产生具有垂直分辨率的点云。

当车辆驶向一个歪斜的路灯或者是低矮的立交桥时,4D雷达能够清晰地测出这些物体底部到地面的净空高度。如果这个高度大于车辆自身的高度加上安全余量,决策系统就会知道那是可以安全通过的,从而避免了不必要的惊慌刹车。

图片源自:网络

4D成像雷达对物体运动状态也可以敏锐观察。通过微多普勒效应,雷达可以捕捉到物体表面极其细微的颤动。像是风吹动树枝时的摇摆,或者是电线杆在气流中的细微共振,这些动态特征在雷达信号中都有独特的表现。

相比之下,停在路边的静止车辆或固定在地面上的障碍物,其信号表现则完全不同。利用这些细微的物理特性,系统能够将悬空的自然景物与人造的结构件区分开来,极大地提升了识别的准确度。

此外,由于无线电波在金属物体上的反射极其强烈,而在植物叶片上的反射较弱,雷达系统通过计算回波的能量强度,也能辅助判断物体的硬度。当一个歪斜的金属灯杆出现在路径上时,雷达会收到一个非常强且集中的反馈信号;而当它遇到树枝时,信号则会显得破碎且分散。

这种对物体“质地”的感应,为自动驾驶汽车在复杂的城市场景中提供了一层额外的安全冗余。即便是激光雷达因为大雾失效,4D成像雷达依然能守住最后一道防线,确保车辆不会一头撞向那些悬挂在高处的硬质物体。

wKgZO2nNwHWAeDR7AAASG3BOmsQ834.jpg

占据网格技术帮汽车理解复杂形状?

除了激光雷达和毫米波雷达,自动驾驶汽车还配备了大量的摄像头。传统的视觉识别方法主要依赖于“目标检测”,也就是给照片里的物体画框。

但是,这种画框的方法在面对悬空物体时会失灵。这是因为一棵垂落的柳树或者一根不规则倾斜的电线杆,很难用一个规整的方框来准确描述它们在空间中的实际位置。

为了更真实地还原世界,一种被称为“占据网格预测”或者“占据网络”的技术正在成为主流。

这种技术不再纠结于“这个物体叫什么”,而是把汽车周围的空间切割成千上万个微小的正方体格子,也就是所谓的“体素”。系统通过深度学习模型去预测每一个格子是被物体占据了,还是空出来的。

wKgZPGnNwHWAfZhFAAE4H9lCoLQ024.jpg

图片源自:网络

对于悬空物体来说,这种方法简直是量身定做的。即使是一个形状极其复杂、半垂半悬的树枝,系统也能通过摄像头捕捉到的多角度画面,计算出它在三维空间中到底占用了哪些格子。

这样一来,车辆的路径规划器会寻找一条完全由“空闲格子”组成的路径,从而巧妙地从悬空物体的下方或侧面绕过去。

在占据网格的体系下,视觉系统能够捕捉到极其细微的语义信息。通过对图像像素的逐个分析,摄像头可以识别出哪些格子属于“植被”,哪些属于“交通设施”。

当车辆面对歪斜的路灯时,视觉系统能识别出其金属顶部的纹理和结构特征,并将其标记为不可逾越的刚性障碍物。而当面对树枝时,如果占据网格显示这些格子的分布非常稀疏,且语义标签显示为“树叶”,系统可能会将其风险权重调低,认为即使发生轻微触碰也不会产生严重后果。

视觉系统还可利用“视差”原理来增强对高度的感知。就像人类用两只眼睛看东西能分辨远近一样,自动驾驶汽车通过多颗不同位置的摄像头,可以计算出同一个物体在不同画面里的位置偏差。

对于悬空物体,这种视差变化非常明显。当汽车行驶时,距离较近的悬空树枝在画面中移动的速度远快于远处的背景。

通过这种动态的视觉信息,系统能够实时更新物体在三维空间中的位置和高度,这种能力在缺乏高精度地图支持的区域尤为关键,它让汽车具备了“边走边看边想”的自主判断能力。

wKgZO2nNwHeAbOfmAAASAJELks8008.jpg

面对不同材质的障碍物时汽车该如何做出决策?

识别出物体只是第一步,更难的是决定“怎么办”。决策规划系统需要根据传感器收集到的所有信息,对悬空物体的威胁程度进行分级。这里涉及到一个非常核心的逻辑,即刚性物体与柔性物体的区分。

歪斜的路灯杆是典型的刚性障碍物,它的直径、材质和位置决定了车辆绝对不能与其发生接触。而树枝则情况复杂,它们可能是柔软的细枝,也可能是足以撞坏前挡风玻璃的粗壮干枯分支。

为了做出准确判断,系统会采用“多传感器融合”的机制。

wKgZPGnNwHmAcnluANjglQ9o894004.jpg

图片源自:网络

想象这样一个场景,车头前方的摄像头识别出了一些绿色的叶子,激光雷达测算出这些叶子距离地面约两米高,而毫米波雷达却几乎没有探测到强烈的反射信号。综合这些信息,系统会得出一个结论,这大概率是一簇低垂的软树枝,不会对行车安全造成实质性威胁。

但如果激光雷达和雷达同时在那个高度探测到了强烈的信号,且视觉系统识别出了灰色的金属质感,系统则会立刻将其判定为危险物体,并在规划路径时将其设为绝对禁区。

针对那些半遮半掩的枝丛状物体,系统还会利用特定的算法来评估它们的“穿透性”。在一些极端的越野或者乡村路况中,车辆可能不得不穿过一些茂密的植被。

此时,系统会分析激光雷达回波的穿透率。如果激光能够轻易穿过物体打到后面的背景上,说明物体非常稀疏;如果激光全部被挡住,说明物体非常结实。这种基于物理特性的判断,使得汽车在决策时不仅仅是在做简单的避障,而是在进行复杂的环境风险评估。

审核编辑 黄宇