Momenta曹旭东:预训练后的大模型会有很多不好的驾驶行为,需要进一步激发对齐


                <!-- 相关专题top end-->
                            <!-- 期货推广begin -->

        <!-- 期货推广end -->

        <!-- 秒拍begin -->

        <!-- 秒拍end -->

        <!-- 视频播放器start -->

        <!-- 视频播放器end -->

        <!-- 行情图begin -->

        <!-- 行情图end -->

<p>  新浪科技讯 4月25日晚间消息,日前2026北京车展开幕,Momenta期间举办“Momenta R7,物理AI序章”主题分享会。会后,Momenta CEO 曹旭东与新浪科技等媒体进行对话。</p>

  谈及“Momenta如何运用海量的用户数据”,曹旭东分享道:“我们可能会分为预训练的阶段和Post-Training的阶段。其中,预训练阶段海量的来自于我们的80万台量产车。海量量产的数据包括了大量的长尾数据,通过World Model Pre-Training来预训练这个模型。”

  他继续道:“预训练完,这个模型会有物理常识,但有物理常识不代表它是一个好司机,因为大量的数据里面有好的驾驶行为,但更多是不好的驾驶行为,所以还是需要Post-Training,把它的行为激发或对齐到人类好的行为上。”

未经允许不得转载:紫竹林-程序员中文网 » Momenta曹旭东:预训练后的大模型会有很多不好的驾驶行为,需要进一步激发对齐
关于我们 免责申明 意见反馈 隐私政策
程序员中文网:公益在线网站,帮助学习者快速成长!
关注微信 技术交流
推荐文章
每天精选资源文章推送
推荐文章
随时随地碎片化学习
推荐文章
发现有趣的