IT之家 5 月 13 日消息,科技媒体 The Decoder 昨日(5 月 12 日)发布博文,报道称 OpenAI 高级模型开发负责人 Jakub Pachocki 指出,AI 推理模型正展现出自主生成知识的潜力。他认为这种推理并非人类思维的翻版,而是基于数据和算法的独特过程。IT之家援引博文介绍,Pachocki 解释,AI 的学习分为两个阶段:首先是无监督预训练,模型吸收海量数据,构建一个无意识、无时间线的“世界模型”(world model),以此理解现实的基本框架。第二阶段则是通过强化学习与人类反馈(RLHF)将基础模型转化为实用助手。Pachocki 强调,这一阶段在最新的推理模型中尤为关键。OpenAI 同时结合传统强化学习,处理有明确对错的任务,而 RLHF 则更适合复杂问题,尽管其扩展性有限。他还质疑预训练与强化学习是否应视为独立阶段,认为推理模型的“思考”根植于预训练数据,二者需深度融合。近期一篇论文指出
OpenAI 高管:AI 未来可自主生成知识,商业与科研迎来革命
2025-05-13 00:00:00来源: 新浪人工智能
上一篇
这一次出海,更让人刮目相看
赞
你的鼓励是对作者的最大支持
- 从抱睡到自主入睡,这些误区70%妈妈都踩坑,快避坑2025-05-15 00:00:00
- AI初创企业Perplexity在新一轮融资中估值飙升至140亿美元2025-05-13 00:00:00
- 微软公司宣布将全球裁员3%,AI烧钱引发人事地震?2025-05-14 00:00:00
- OpenAI阿尔特曼:年轻人把ChatGPT当操作系统,中老年用来替代谷歌2025-05-14 00:00:00
- 今日是农历四月十七,迎来了我家甄嬛的319岁生辰!2025-05-14 00:00:00
- 微软裁员3%,美国科技巨头“一边巨资投AI,一边发力大裁员”2025-05-14 00:00:00