新关注 > 信息聚合 > 蚂蚁自研2900亿大模型用国产AI芯片训练，计算成本508万元低于DeepSeek｜钛媒体AGI

蚂蚁自研2900亿大模型用国产AI芯片训练，计算成本508万元低于DeepSeek｜钛媒体AGI

2025-03-24 00:00:00来源: 新浪财经头条

蚂蚁自研2900亿大模型用国产AI芯片训练，计算成本508万元低于DeepSeek｜钛媒体AGI

图片地址：https://n.sinaimg.cn/sinakd20250324s/43/w2048h1195/20250324/9f69-920cc4b95656111c3c8435472f9d224f.jpg

来源：钛媒体（图片来源：钛媒体AGI编辑林志佳拍摄）随着DeepSeek引发 AI 算力优化热潮，蚂蚁集团全面发力 AI 技术，基于中国AI芯片进行Infra，实现了模型技术突破。3月24日消息，钛媒体AGI获悉，近日，蚂蚁集团CTO、平台技术事业群总裁何征宇带领Ling Team团队，利用AI Infra技术，开发了两个百灵系列开源MoE模型Ling-Lite 和 Ling-Plus，前者参数规模168亿，Plus基座模型参数规模高达2900亿，相比之下，AI行业估计GPT-4.5参数量1.8万亿，DeepSeek-R1参数规模达6710亿。同时，论文显示，蚂蚁团队在模型预训练阶段使用较低规格的硬件系统，将计算成本降低约20%，达508万元人民币，最终实现与阿里通义Qwen2.5-72B-Instruct 和 DeepSeek-V2.5-1210-Chat相当的性能。目前，相关技术成果论文发表在预印版Arxiv平台上。据

标签： AGI 自研 2900 亿大 DeepSeek 508 AI 蚂蚁国产 PS SE 芯片模型

上一篇周杰伦现身F1上海赛林志颖被拍肩让C位像苏醒

下一篇 IDC：2025年全球智能眼镜市场出货量预计同比增18.3%

赞

你的鼓励是对作者的最大支持

相关阅读

英伟达最强对手来了，芯片格局或被改写2025-03-25 00:00:00
AI家电，摆脱噱头？2025-03-25 00:00:00
高通骁龙 8s 至尊版芯片曝光：无自研 Oryon 核心，安兔兔跑分逼近 200 万2025-03-24 00:00:00
三星全力研发Exynos 2600芯片确保Galaxy S26系列按时上市2025-03-24 00:00:00
出圈的阿里AI旗舰夸克“超级框”，崛起的AI时代“超级入口”2025-03-25 00:00:00
视频 | AI误诊，谁来“背锅”？2025-03-24 00:00:00
AWE2025闭幕：AI+产业共振，绘就全场景智慧生活2025-03-23 00:00:00
无惧AI，洗衣机彻底放飞，AWE上大秀“多筒”“集成”新玩法2025-03-24 00:00:00
DeepSeek 发布 V3 模型更新：除了编程能力大幅提升，还有更宽松的开源协议2025-03-24 00:00:00
DeepSeek昨夜上新！新旧版V3对比实测，代码能力飙升，震惊海外用户2025-03-25 00:00:00

热门排行榜

1日1周1月

最新图片