来源:华尔街见闻 阿里巴巴周一发布并开源通义千问3.0(Qwen3)系列模型,并称其在数学和编程等多个方面均可与DeepSeek的性能相媲美。与其他主流模型相比,Qwen3还显著降低了部署成本。阿里表示,Qwen3无缝集成两种思考模式,支持119种语言,便于Agent调用。 性能媲美DeepSeek R1、OpenAI o1,全部开源 Qwen3系列包括两个专家混合 (MoE) 模型和另外六个模型。阿里巴巴表示,最新发型的旗舰模型Qwen3-235B-A22B在代码、数学、通用能力等基准测试中,与DeepSeek-R1、o1、o3-mini、Grok-3和Gemini-2.5-Pro等顶级模型相比,表现出极具竞争力。 此外,被称为“专家混合”(MoE,Mixture-of-Experts)模型的Qwen3-30B-A3B的激活参数数量是QwQ-32B的10%,表现更胜一筹,甚至像Qwen3-4B这样的小模型也能匹敌Qwe
清晨重磅!阿里发布并开源Qwen3,无缝集成思考模式、多语言、便于Agent调用
2025-04-29 00:00:00来源: 市场资讯
赞
你的鼓励是对作者的最大支持
- 这两天在看《苦尽柑来遇见你》, 有一点引发了我的思考2025-04-28 00:00:00
- 重磅!半导体全产业链国产替代名单,包含各细分领域全球及中国市场规模、国产化率、国产替代企业、投融资热点2025-04-27 00:00:00
- 李现和网红恋爱,张檬破坏军婚,陈妍希无缝斜街2025-04-28 09:48:50
- 认知偏差客观存在,理解不同思考角度2025-04-26 00:00:00
- 早安问候愿你清晨阳光照亮梦想之路2025-04-27 00:00:00