来源:钛媒体 (图片来源:钛媒体AGI编辑林志佳拍摄) 随着DeepSeek引发 AI 算力优化热潮,蚂蚁集团全面发力 AI 技术,基于中国AI芯片进行Infra,实现了模型技术突破。3月24日消息,钛媒体AGI获悉,近日,蚂蚁集团CTO、平台技术事业群总裁何征宇带领Ling Team团队,利用AI Infra技术,开发了两个百灵系列开源MoE模型Ling-Lite 和 Ling-Plus,前者参数规模168亿,Plus基座模型参数规模高达2900亿,相比之下,AI行业估计GPT-4.5参数量1.8万亿,DeepSeek-R1参数规模达6710亿。同时,论文显示,蚂蚁团队在模型预训练阶段使用较低规格的硬件系统,将计算成本降低约20%,达508万元人民币,最终实现与阿里通义Qwen2.5-72B-Instruct 和 DeepSeek-V2.5-1210-Chat相当的性能。目前,相关技术成果论文发表在预印版Arxiv平台上。据
蚂蚁自研2900亿大模型用国产AI芯片训练,计算成本508万元低于DeepSeek|钛媒体AGI
2025-03-24 00:00:00来源: 新浪财经头条
赞
你的鼓励是对作者的最大支持
- 英伟达最强对手来了,芯片格局或被改写2025-03-25 00:00:00
- AI家电,摆脱噱头?2025-03-25 00:00:00
- 高通骁龙 8s 至尊版芯片曝光:无自研 Oryon 核心,安兔兔跑分逼近 200 万2025-03-24 00:00:00
- 三星全力研发Exynos 2600芯片确保Galaxy S26系列按时上市2025-03-24 00:00:00
- 出圈的阿里AI旗舰夸克“超级框”,崛起的AI时代“超级入口”2025-03-25 00:00:00
- 视频 | AI误诊,谁来“背锅”?2025-03-24 00:00:00
- AWE2025闭幕:AI+产业共振,绘就全场景智慧生活2025-03-23 00:00:00
- 无惧AI,洗衣机彻底放飞,AWE上大秀“多筒”“集成”新玩法2025-03-24 00:00:00
- DeepSeek 发布 V3 模型更新:除了编程能力大幅提升,还有更宽松的开源协议2025-03-24 00:00:00
- DeepSeek昨夜上新!新旧版V3对比实测,代码能力飙升,震惊海外用户2025-03-25 00:00:00