新关注 > 信息聚合 > 蚂蚁自研2900亿大模型用国产AI芯片训练,计算成本508万元低于DeepSeek|钛媒体AGI

蚂蚁自研2900亿大模型用国产AI芯片训练,计算成本508万元低于DeepSeek|钛媒体AGI

2025-03-24 00:00:00来源: 新浪财经头条

来源:钛媒体 (图片来源:钛媒体AGI编辑林志佳拍摄) 随着DeepSeek引发 AI 算力优化热潮,蚂蚁集团全面发力 AI 技术,基于中国AI芯片进行Infra,实现了模型技术突破。3月24日消息,钛媒体AGI获悉,近日,蚂蚁集团CTO、平台技术事业群总裁何征宇带领Ling Team团队,利用AI Infra技术,开发了两个百灵系列开源MoE模型Ling-Lite 和 Ling-Plus,前者参数规模168亿,Plus基座模型参数规模高达2900亿,相比之下,AI行业估计GPT-4.5参数量1.8万亿,DeepSeek-R1参数规模达6710亿。同时,论文显示,蚂蚁团队在模型预训练阶段使用较低规格的硬件系统,将计算成本降低约20%,达508万元人民币,最终实现与阿里通义Qwen2.5-72B-Instruct 和 DeepSeek-V2.5-1210-Chat相当的性能。目前,相关技术成果论文发表在预印版Arxiv平台上。据