新关注 > 信息聚合 > 国泰君安:DEEPSEEK模型降本打开AI应用产业上升通道 腾讯、小米等有望受益

国泰君安:DEEPSEEK模型降本打开AI应用产业上升通道 腾讯、小米等有望受益

2025-02-04 00:00:00来源: 新浪港股

国泰君安发布研报称,DeepSeek实现模型大幅降本,价值有望从模型层转移至应用层。DeepSeek成为全球DAU增速最快的AI应用,20天达成DAU 2000万,带来巨大的推理算力需求。推荐算力方面受益的英伟达(NVDA.US)、台积电(TSM.US)以及应用方面受益的腾讯(00700)、小米(01810)、Meta(META.US)、谷歌(GOOGL.US)。 国泰君安主要观点如下: DeepSeek通过多处工程创新,实现降低训练成本、降低推理成本、提高模型效果等进展 1)降低训练成本:DeepSeek使用较宽的MOE架构,且提出共享专家机制,每次训练只激活需要的专家(按需调用),而非激活全部专家,从而大大降低训练成本。此外,使用fp8低精度训练、双管道训练、多Token预测等方法进一步降低训练成本。 2)降低推理成本:DeepSeek提出多头潜在注意力(MLA),在不牺牲模型质量的前提下,大幅减少KV缓存的大小。此外,低精