OpenAI 高管：AI 未来可自主生成知识，商业与科研迎来革命

图片地址：https://n.sinaimg.cn/spider20250513/120/w1440h1080/20250513/9986-dd46237e7e368097f628064718377fcc.jpg

IT之家 5 月 13 日消息，科技媒体 The Decoder 昨日（5 月 12 日）发布博文，报道称 OpenAI 高级模型开发负责人 Jakub Pachocki 指出，AI 推理模型正展现出自主生成知识的潜力。他认为这种推理并非人类思维的翻版，而是基于数据和算法的独特过程。IT之家援引博文介绍，Pachocki 解释，AI 的学习分为两个阶段：首先是无监督预训练，模型吸收海量数据，构建一个无意识、无时间线的“世界模型”（world model），以此理解现实的基本框架。第二阶段则是通过强化学习与人类反馈（RLHF）将基础模型转化为实用助手。Pachocki 强调，这一阶段在最新的推理模型中尤为关键。OpenAI 同时结合传统强化学习，处理有明确对错的任务，而 RLHF 则更适合复杂问题，尽管其扩展性有限。他还质疑预训练与强化学习是否应视为独立阶段，认为推理模型的“思考”根植于预训练数据，二者需深度融合。近期一篇论文指出