新瓜,主角是昨天刚刚发布的Meta旗舰大模型——Llama 4内部爆料:性能不达标,压力下欲“优化”结果?首先引爆讨论的是一篇来自“一亩三分地”论坛的帖子,发帖人自称是参与Llama 4训练的内部员工,并表示已因此辞职 帖子内容信息量很大,主要说了几点:这篇帖子迅速引发了圈内关注,大家都在讨论这种做法是否违背了AI研发的基本诚信这是后续,真实情况还有待于观察 外部观察:TechCrunch质疑测试版本“误导性”无独有偶,知名科技媒体TechCrunch也发文,标题直指Meta新AI模型的性能测试“有点误导人”。TechCrunch的文章主要聚焦于Llama 4(即Maverick)在著名的人类评估排行榜LM Arena上的表现。Maverick确实取得了第二名的好成绩,但这背后似乎另有隐情: 一些Llama 4的实测号称千万上下文的召回率,上下文的实际表现,远低于预期 Llama 4 Maverick 在 aid
大瓜来了!Llama 4 陷刷榜争议:“内部员工”发帖控诉,测评版本被指特供?
2025-04-07 00:00:00来源: 网易新闻
赞
你的鼓励是对作者的最大支持
- 冯小刚再惹争议,携手赵丽颖的《向阳花》惨败2025-04-15 02:45:04
- 给2025演技最好女演员排名,孙俪第8,第1无争议2025-04-13 06:20:03
- 中国移动易芝玲:理性看待争议 加快RAN网络架构变革2025-04-12 00:00:00
- 孩子幼儿园入园测评,老师建议的第一件事:减少家里多余的玩具2025-04-11 00:00:00
- 戴尔再裁中国区员工,曾称全面停用中国芯片,并已与大中华区总经理陷入劳动纠纷|钛媒体独家2025-04-10 00:00:00
- Llama 4五大疑点曝光,逐层扒皮,全球AI进步停滞,NYU教授称Scaling彻底结束2025-04-09 00:00:00
- Meta高管澄清:新AI模型Llama 4训练“作弊”传言不属实2025-04-08 00:00:00
- 消息称微软解雇了两名在50周年庆典上抗议以色列合同的员工2025-04-08 00:00:00
- 消息称谷歌付钱让部分 AI 员工赋闲一年,以防其投奔竞争对手2025-04-08 00:00:00
- Meta Llama 4被疑考试「作弊」:在竞技场刷高分,但实战中频频翻车2025-04-07 00:00:00