新关注 > 信息聚合 > 大瓜来了！Llama 4 陷刷榜争议：“内部员工”发帖控诉，测评版本被指特供？

大瓜来了！Llama 4 陷刷榜争议：“内部员工”发帖控诉，测评版本被指特供？

2025-04-07 00:00:00来源: 网易新闻

大瓜来了！Llama 4 陷刷榜争议：“内部员工”发帖控诉，测评版本被指特供？

图片地址：https://n.sinaimg.cn/spider20250407/300/w660h440/20250407/4513-45ff533ab1c3118403012c488b134318.jpg

新瓜，主角是昨天刚刚发布的Meta旗舰大模型——Llama 4内部爆料：性能不达标，压力下欲“优化”结果？首先引爆讨论的是一篇来自“一亩三分地”论坛的帖子，发帖人自称是参与Llama 4训练的内部员工，并表示已因此辞职帖子内容信息量很大，主要说了几点：这篇帖子迅速引发了圈内关注，大家都在讨论这种做法是否违背了AI研发的基本诚信这是后续，真实情况还有待于观察外部观察：TechCrunch质疑测试版本“误导性”无独有偶，知名科技媒体TechCrunch也发文，标题直指Meta新AI模型的性能测试“有点误导人”。TechCrunch的文章主要聚焦于Llama 4（即Maverick）在著名的人类评估排行榜LM Arena上的表现。Maverick确实取得了第二名的好成绩，但这背后似乎另有隐情：一些Llama 4的实测号称千万上下文的召回率，上下文的实际表现，远低于预期 Llama 4 Maverick 在 aid

标签：大瓜来 Llama 陷刷指特供测评控诉发帖争议员工版本

上一篇苹果公司不太可能在美国组装iPhone，因成本过高

下一篇速自查！有人深夜被盗刷162笔，只因开通了它

赞

你的鼓励是对作者的最大支持

相关阅读

冯小刚再惹争议，携手赵丽颖的《向阳花》惨败2025-04-15 02:45:04
给2025演技最好女演员排名，孙俪第8，第1无争议2025-04-13 06:20:03
中国移动易芝玲：理性看待争议加快RAN网络架构变革2025-04-12 00:00:00
孩子幼儿园入园测评，老师建议的第一件事：减少家里多余的玩具2025-04-11 00:00:00
戴尔再裁中国区员工，曾称全面停用中国芯片，并已与大中华区总经理陷入劳动纠纷｜钛媒体独家2025-04-10 00:00:00
Llama 4五大疑点曝光，逐层扒皮，全球AI进步停滞，NYU教授称Scaling彻底结束2025-04-09 00:00:00
Meta高管澄清：新AI模型Llama 4训练“作弊”传言不属实2025-04-08 00:00:00
消息称微软解雇了两名在50周年庆典上抗议以色列合同的员工2025-04-08 00:00:00
消息称谷歌付钱让部分 AI 员工赋闲一年，以防其投奔竞争对手2025-04-08 00:00:00
Meta Llama 4被疑考试「作弊」：在竞技场刷高分，但实战中频频翻车2025-04-07 00:00:00

热门排行榜

1日1周1月

最新图片