新关注 > 信息聚合 > Waymo利用谷歌Gemini大语言模型,开发端到端自动驾驶模型

Waymo利用谷歌Gemini大语言模型,开发端到端自动驾驶模型

2024-10-31 00:00:00来源: 砍柴网

10 月 31 日消息,自动驾驶公司 Waymo 长期以来一直将与谷歌 DeepMind 的联系及其数十年的 AI 研究视为其在自动驾驶领域超越竞争对手的战略优势。现在这家 Alphabet 旗下的公司更进一步,为其机器人出租车开发一种基于谷歌多模态大语言模型(MLLM)“Gemini”的新训练模型。 Waymo 今天发布了一篇新的研究论文,介绍了一种名为“端到端多模态自动驾驶模型”(EMMA)的新模型。这种新的端到端训练模型能够处理传感器数据,生成“自动驾驶车辆的未来轨迹”,帮助 Waymo 的无人驾驶车辆做出关于去哪里以及如何避开障碍物的决策。但更重要的是,这是首次有迹象表明,自动驾驶领域的领导者计划将 MLLM 应用于其业务。这意味着 MLLM 可能不仅仅局限于聊天机器人、电子邮件组织者和图像生成器等领域,而是可以扩展到自动驾驶领域。在研究中 Waymo 提出,传统的自动驾驶系统通常会为感知、映射、预测和规划等各种功能