国泰君安发布研报称,DeepSeek实现模型大幅降本,价值有望从模型层转移至应用层。DeepSeek成为全球DAU增速最快的AI应用,20天达成DAU 2000万,带来巨大的推理算力需求。推荐算力方面受益的英伟达(NVDA.US)、台积电(TSM.US)以及应用方面受益的腾讯(00700)、小米(01810)、Meta(META.US)、谷歌(GOOGL.US)。 国泰君安主要观点如下: DeepSeek通过多处工程创新,实现降低训练成本、降低推理成本、提高模型效果等进展 1)降低训练成本:DeepSeek使用较宽的MOE架构,且提出共享专家机制,每次训练只激活需要的专家(按需调用),而非激活全部专家,从而大大降低训练成本。此外,使用fp8低精度训练、双管道训练、多Token预测等方法进一步降低训练成本。 2)降低推理成本:DeepSeek提出多头潜在注意力(MLA),在不牺牲模型质量的前提下,大幅减少KV缓存的大小。此外,低精
国泰君安:DEEPSEEK模型降本打开AI应用产业上升通道 腾讯、小米等有望受益
2025-02-04 00:00:00来源: 新浪港股
赞
你的鼓励是对作者的最大支持
- 一个行业的AI样板:教培的不同环节怎么被改写2025-02-04 00:00:00
- 尼古拉斯・凯奇抨击 AI 演员:不要让机器人为我们做梦2025-02-04 00:00:00
- 一天适配!天数智芯联合Gitee AI正式上线DeepSeek R1模型服务2025-02-04 00:00:00
- 1张艺谋初六回国 女儿张末儿子张壹男全程送机
- 2炒作?割韭菜?EOS “天价” 安全漏洞,不过是周鸿祎蓄谋策划的一次营销事件
- 3国家市场监督管理总局:对谷歌公司立案调查
- 4不满足只能换电脑!微软移除绕过硬件限制升级Win11教程
- 5一个行业的AI样板:教培的不同环节怎么被改写
- 6realme 真我 GT7 Pro 竞速版手机 Geekbench 6 跑分出炉
- 7三星 Home UP 更新:支持调整手势动画、图标缩放等
- 8开发者找到 Pixel 手机屏幕卡顿原因,盼谷歌修复
- 9年夜饭桌上的一抹“中国红”:创新春节IP消费 红花郎成国人“过年搭子”
- 10国泰君安:DEEPSEEK模型降本打开AI应用产业上升通道 腾讯、小米等有望受益