1 | 论文链接:https://arxiv.org/abs/2302.02367 |
1 引言
目前基于激光雷达的主流方法分为基于点云的方法和基于体素的方法。前者能保留最多的几何信息,但逐点查询和遍历较为耗时;后者使用3D/2D卷积处理体素化点云,但用于提高效率的3D稀疏卷积对实际部署不友好。
PointPillars作为deploy-friendly的方法,使用对部署有利的2D卷积。但由于其使用最大池化提取每个柱体内点的特征,无法获取细粒度特征,影响最终性能(特别是对于小物体)。此外,其neck网络FPN直接融合多尺度特征,缺少充分的特征交互。尽管PillarNet提高了PointPillars的性能,但其使用了部署困难的稀疏卷积。
论文提出FastPillars,基于标准卷积,容易部署。网络包含4个部分:piller柱体编码、特征提取、特征融合和3D边界框回归。对于piller编码,提出最大-注意力柱体编码(MAPE)模块,在不引入额外计算时间的情况下自动学习局部几何模式。对于特征提取,提出紧凑而高效的主干网络CRVNet。特征融合模块中,通过层次融合不同尺度和感受野的特征丰富语义特征。3D边界框回归使用基于中心的方法。