编程能力更强了,还有呢?作者|张勇毅和上周不少朋友期待的一样,新一周第一天的北京时间 3 月 24 日晚,DeepSeek 果然「突然」发布了模型更新。 但暂时还不是 DeepSeek V4 或 R2,而是 DeepSeek V3 模型的一次更新。目前,其开源版本目前已经上架开源网站。其开源版本模型体积为 6850 亿参数。 深度求索微信官方公众号也确认,本次更新属于小版本升级,目前已经在官方网页、App 小程序等入口开放。 初代 V3 模型最为人所熟知的,可能还是「557.6万美金比肩Claude 3.5效果」的超级性价比。而更新后的模型由其新的 32KGPU 集群上改进的后训练提供支持。截至目前,还没有任何关于新版 DeepSeek V3 的能力基准测试榜单出现,但有了 DeepSeek V3 发布即成为 Chatbot Arena 榜单前十中唯一一个开源模型的刷榜历史,还是在发布一小时后迅速吸引来全球用户对其测
DeepSeek 发布 V3 模型更新:除了编程能力大幅提升,还有更宽松的开源协议
2025-03-24 00:00:00来源: 微资讯
下一篇
低调的“算力革命”
赞
你的鼓励是对作者的最大支持
- 华为擎云L420x性能旗舰商务本发布 搭载2.8K OLED屏2025-03-25 00:00:00
- 问界M9激光投影系统确认由极米打造 分辨率提升200%2025-03-24 00:00:00
- 智能时代,“新人才”需要具备这3种能力2025-03-25 00:00:00
- 外界热议DeepSeek低调“上新”2025-03-26 00:00:00
- DeepSeek之后,国产芯片立功,AI训练成本再“打八折”2025-03-26 00:00:00
- OpenAI和Google同日地震级更新:人间一夜,AGI临近!2025-03-26 00:00:00
- 增强版Sora生图模型发布:不仅能直接在ChatGPT用,还抢了梗图作者的饭碗2025-03-26 00:00:00
- 涉及婴幼儿配方乳粉 市场监管总局发布两项风险防控指南2025-03-25 00:00:00
- 人到中年,拼的是存钱能力2025-03-25 00:00:00
- 人的一生,犯错不可怕,不成长和更新自己才最可怕2025-03-25 00:00:00