文 丨 新浪科技 周文猛 在训练人工智能大模型的过程中,采购超级计算服务或存储器,也正在成为有效缓解算力焦虑的新途径。 近日,中国工程院院士、清华大学计算机系教授郑纬民在与新浪科技沟通中指出,“过去训练一个大模型要投入几十亿,但如果把大模型训练拿到超算上去做,价钱只需要用到英伟达的六分之一。” 此外,郑纬民还指出了一种全新的AI推理发展新趋势——“以存换算”。他以清华大学与AI独角兽企业月之暗面共同开发的Mooncake技术框架为例,介绍了该技术基于“以存换算”思路,帮助月之暗面kimi智能助手缓解算力紧张需求的原理,从而避免服务器宕机。 “把大模型训练搬到超算上,价钱只需英伟达1/6” 郑纬民看到,在经过ChatGPT发布后全球各科技企业快速追赶后,今年大模型有两个特点:第一,基础大模型进入多模态状态,不只有文本,还有图像、视频等;第二,真的用起来了,大模型正与各行业实际的结合,比如大模型+金融,大模型+医疗、大模型+汽车、大
对话郑纬民院士:用超算做AI大模型训练,成本只需英伟达1/6
2024-12-31 00:00:00来源: 新浪科技
赞
你的鼓励是对作者的最大支持
- 对话潇阳:安静的高级感,打造情感盛宴2025-01-02 00:00:00
- 对话清华大学长聘副教授喻纯:AI+教育可能使人人成为马斯克2025-01-01 00:00:00
- 对话 vivo 胡柏山:手机行业就是最典型的新质生产力,MR 原型机今年见2025-01-01 00:00:00
- 我们要做的,是学会与焦虑对话2025-01-02 00:00:00
- 科技圈AI速递:昨夜今晨科技热点一览丨2025年1月1日2025-01-01 00:00:00
- 阿里巴巴:AI产品“生意管家”已累计服务400万商家2025-01-01 00:00:00
- 和AI建立亲密关系,资本盯上中产贵妇2025-01-01 00:00:00
- 人工智能2024:模型端OpenAI走下神坛,应用端商业化渐清晰2025-01-01 00:00:00
- 博远资本陈鹏辉对话百利天恒创始人朱义:十年之变与新年之势|2025展望2024-12-31 00:00:00
- 震惊!OpenAI的o1-preview模型在国际象棋对决中“作弊”取胜2024-12-31 00:00:00