- 机器之心Pro2025-05-11 00:00:00
...,Natvie 多模态大模型的 Scaling Law 有所不同吗?什么是Native多模态模型?相较目前流行的「晚融合」方案,「早融合」的Native多模态模型的训练过程有何不同?苹果公司近期发布的「NNM」技术报告中,有哪些反直觉的新发...
- 网易新闻2025-04-10 00:00:00
... 团队的新作《EAGLE-3: Scaling up Inference Acceleration of Large Language Models via Training-Time Test》通过一系列优化解锁了投机采样的 Scalin...
- 微资讯2025-04-09 00:00:00
...总结了目前这段时间AI圈的状况。Scaling已经结束;模型仍然无法可靠推理;金融泡沫正在破裂;依然没有GPT-5;对不可靠的语言模型的过度依赖让世界陷入了困境。我的25个2025年预测中的每一个,目前看起来都是对的。大语言模型不是解决之道...
- 网易新闻2025-03-26 00:00:00
...需求。受到 Test-Time Scaling 在 LLM 中的应用启发,来自清华大学、腾讯的研究团队首次对视频生成的 Test-Time Scaling 进行探索,表明了视频生成也能够进行 Test-Time Scaling 以提升性能,...
- 机器之心Pro2024-12-22 00:00:00
...?03. 预训练的终结本质上是 Scaling Law 的范式转移?预训练终结和 Scaling Law 有何联系?Ilya 和 Sam Altman 的观点有冲突吗?Il...
- 机器之心Pro2024-12-15 00:00:00
...结束?AI的下一步发展有何论调?Scaling Law 撞墙与否还重要吗?预训练数据还能继续 Scale 多少? AI的下一步发展有哪些论调?哪些工作在推理阶段给 LLM 打补丁?哪些工作在用更高维度的数据做 WM?哪些探索方向不受「撞墙争...
- 网易新闻2024-12-07 00:00:00
... 革命,模型参数规模形成指数级“Scaling Law”发展。在发布24个月后...
- 新浪人工智能2024-11-11 00:00:00
整理 | 华卫、核子可乐近日,有外媒报道称,OpenAI 正在制定新策略,以应对人工智能大模型改进速度放缓的问题。消息一出,知名认知科学家、AI 研究员 Gary Marcus 立即表示,“正如我所说,GPT 正在进入收益递减的时期。”而近...