新关注 > 信息聚合 > OpenAI o3震撼觉醒,AGI今夜降临?血洗o1,破解陶哲轩最难数学题

OpenAI o3震撼觉醒,AGI今夜降临?血洗o1,破解陶哲轩最难数学题

2024-12-21 00:00:00来源: 创事记

12天最后一天,OpenAI下一代推理模型o3真的出世了! 奥特曼、Mark Chen、任泓宇和ARC Prize基金会主席Greg Kamradt为我们做了介绍 正如所爆料那样,突如其来的o3成为整场直播的「压轴菜」。奥特曼表示,之所以跳过o2,是因为对伙伴的尊重,以及延续OpenAI一贯「起名特别差」的传统。 要知道,距离9月o1的出世,才过去了整整3个月的时间。o3的迭代速度,证明了Scaling Law似乎并未终结。 根据Keras之父发布的报告称,o3在低计算量模式下,每个任务需要花费高达20美金,而在高计算量模式中每个任务则需要数千美元。o3数学代码封神,粉碎o1在多项基准测试中,o3再次刷新SOTA,就数学、代码、软件工程等领域,完全粉碎了满血版o1!在AIME 2024数学竞赛评测中,o3取得了96.7%的准确率,性能直接飙升13.4%;在博士级科学问答基准GPQA Diamond上,o3准确率为87.