Waymo利用谷歌Gemini大语言模型，开发端到端自动驾驶模型

图片地址：https://n.sinaimg.cn/spider20241031/157/w1125h632/20241031/81e2-e3efb6db01914ce43ac37bca277c9828.jpg

10 月 31 日消息，自动驾驶公司 Waymo 长期以来一直将与谷歌 DeepMind 的联系及其数十年的 AI 研究视为其在自动驾驶领域超越竞争对手的战略优势。现在这家 Alphabet 旗下的公司更进一步，为其机器人出租车开发一种基于谷歌多模态大语言模型（MLLM）“Gemini”的新训练模型。 Waymo 今天发布了一篇新的研究论文，介绍了一种名为“端到端多模态自动驾驶模型”（EMMA）的新模型。这种新的端到端训练模型能够处理传感器数据，生成“自动驾驶车辆的未来轨迹”，帮助 Waymo 的无人驾驶车辆做出关于去哪里以及如何避开障碍物的决策。但更重要的是，这是首次有迹象表明，自动驾驶领域的领导者计划将 MLLM 应用于其业务。这意味着 MLLM 可能不仅仅局限于聊天机器人、电子邮件组织者和图像生成器等领域，而是可以扩展到自动驾驶领域。在研究中 Waymo 提出，传统的自动驾驶系统通常会为感知、映射、预测和规划等各种功能