小鹏联合北大提出全新视觉Token剪枝框架,何小鹏:在探索L4路上又取得新突破


                <!-- 相关专题top end-->
                            <!-- 期货推广begin -->

        <!-- 期货推广end -->

        <!-- 秒拍begin -->

        <!-- 秒拍end -->

        <!-- 视频播放器start -->

        <!-- 视频播放器end -->

        <!-- 行情图begin -->

        <!-- 行情图end -->

<p>  新浪科技讯 12月28日下午消息,近日,人工智能领域国际会议AAAI 2026公布了论文录用结果,由小鹏汽车和北京大学计算机学院多媒体信息处理全国重点实验室联合完成的论文《FastDriveVLA: Efficient End-to-End Driving via Plug-and-Play Reconstruction-based Token Pruning》成功入选。这篇论文最大的贡献在于,提出了一种专门为端到端自动驾驶VLA模型定制的、高效的视觉Token剪枝框架——FastDriveVLA。</p>

  据介绍,FastDriveVLA包含一个即插即用的视觉Token剪枝器ReconPruner。在车端模型的推理阶段, ReconPruner可直接嵌入自动驾驶VLA模型用于视觉Token的剪枝,即插即用,无需重新训练整个模型。为了辅助该剪枝器的训练,还专门构建了包含来自6个摄像头视角的24.1万个图像-掩码对的nuScenes-FG数据集。这一大规模的自动驾驶前景分割标注数据集,可广泛用于未来自动驾驶的研究。

  最终,nuScenes自动驾驶数据集上的测试显示,采用这一剪枝框架,在不同剪枝率下均取得当前最优即SOTA效果:剪枝比例达25%视觉Token时,驾驶性能几乎不下降,其L2轨迹误差与碰撞率指标甚至超越未剪枝的基准模型;剪枝比例达50%Token时,在所有指标上表现更平衡;与此同时,VLA模型的推理效率得到了显著提升。

  小鹏汽车联合北大提出的FastDriveVLA,建立了自动驾驶VLA模型的高效视觉Token剪枝的新范式,同时树立了车端大模型高效部署上车的新标杆。小鹏汽车董事长何小鹏在微博上对此表示,“很高兴我们在探索L4的路上又取得新的突破。我们会在物理AI领域继续发力,期待第二代VLA给鹏友们带来更棒的智驾体验。”



Source link

未经允许不得转载:紫竹林-程序员中文网 » 小鹏联合北大提出全新视觉Token剪枝框架,何小鹏:在探索L4路上又取得新突破

评论 抢沙发

  • 昵称 (必填)
  • 邮箱 (必填)
  • 网址
关于我们 免责申明 意见反馈 隐私政策
程序员中文网:公益在线网站,帮助学习者快速成长!
关注微信 技术交流
推荐文章
每天精选资源文章推送
推荐文章
随时随地碎片化学习
推荐文章
发现有趣的