“Scaling”相关信息聚合

新关注 > “Scaling”相关信息聚合

早融合 VS 晚融合，Natvie 多模态大模型的 Scaling Law 有所不同吗？

机器之心Pro2025-05-11 00:00:00

...，Natvie 多模态大模型的 Scaling Law 有所不同吗？什么是Native多模态模型？相较目前流行的「晚融合」方案，「早融合」的Native多模态模型的训练过程有何不同？苹果公司近期发布的「NNM」技术报告中，有哪些反直觉的新发...
大模型推理无损加速6.5倍!EAGLE-3碾压一切、延续Scaling Law能力

网易新闻2025-04-10 00:00:00

... 团队的新作《EAGLE-3: Scaling up Inference Acceleration of Large Language Models via Training-Time Test》通过一系列优化解锁了投机采样的 Scalin...
Llama 4五大疑点曝光，逐层扒皮，全球AI进步停滞，NYU教授称Scaling彻底结束

微资讯2025-04-09 00:00:00

...总结了目前这段时间AI圈的状况。Scaling已经结束;模型仍然无法可靠推理;金融泡沫正在破裂;依然没有GPT-5;对不可靠的语言模型的过度依赖让世界陷入了困境。我的25个2025年预测中的每一个，目前看起来都是对的。大语言模型不是解决之道...
视频生成的测试时Scaling时刻！清华开源Video-T1，无需重新训练

网易新闻2025-03-26 00:00:00

...需求。受到 Test-Time Scaling 在 LLM 中的应用启发，来自清华大学、腾讯的研究团队首次对视频生成的 Test-Time Scaling 进行探索，表明了视频生成也能够进行 Test-Time Scaling 以提升性能，...
Ilya 小题大作？「预训练终结」≠ Scaling Law 撞墙？

机器之心Pro2024-12-22 00:00:00

...？03. 预训练的终结本质上是 Scaling Law 的范式转移？预训练终结和 Scaling Law 有何联系？Ilya 和 Sam Altman 的观点有冲突吗？Il...
预训练将结束？AI的下一步发展有何论调？Scaling Law 撞墙与否还重要吗？

机器之心Pro2024-12-15 00:00:00

...结束？AI的下一步发展有何论调？Scaling Law 撞墙与否还重要吗？预训练数据还能继续 Scale 多少? AI的下一步发展有哪些论调？哪些工作在推理阶段给 LLM 打补丁？哪些工作在用更高维度的数据做 WM？哪些探索方向不受「撞墙争...
张宏江消除“Scaling Law放缓”恐惧，直言未来将迎来“自主智能”的世界｜2024 T-EDGE

网易新闻2024-12-07 00:00:00

... 革命，模型参数规模形成指数级“Scaling Law”发展。在发布24个月后...
天塌了，Scaling Law 已撞收益递减墙？OpenAI 在内，所有大模型都正遭遇巨大瓶颈

新浪人工智能2024-11-11 00:00:00

整理 | 华卫、核子可乐近日，有外媒报道称，OpenAI 正在制定新策略，以应对人工智能大模型改进速度放缓的问题。消息一出，知名认知科学家、AI 研究员 Gary Marcus 立即表示，“正如我所说，GPT 正在进入收益递减的时期。”而近...