IT之家 11 月 3 日消息,字节跳动豆包大模型团队与香港大学公开联合研究成果 —— HybridFlow。官方宣称,HybridFlow(开源项目名:veRL)是一个灵活且高效的大模型 RL 训练框架,兼容多种训练和推理框架,支持灵活的模型部署和多种 RL 算法实现。该框架采用混合编程模型,融合单控制器(Single-Controller)的灵活性和多控制器(Multi-Controller)的高效性,可更好实现和执行多种 RL 算法,显著提升训练吞吐量,降低开发和维护复杂度。 ▲ 3D-HybridEngine(训练推理混合技术)一次迭代的流程 实验结果表明,HybridFlow 在各种模型规模和 RL 算法下,训练吞吐量相比其他框架提升了 1.5 倍至 20 倍。目前,该论文已被 EuroSys 2025 接收,代码仓库也对外公开,IT之家附相关链接如下:论文链接:https://arxiv.org/abs/2409.
提升 1.5~20 倍吞吐量,字节豆包大模型团队与香港大学发布并开源全新 RLHF 框架
2024-11-03 00:00:00来源: IT之家
赞
你的鼓励是对作者的最大支持
- 字节跳动的图虫往事2024-11-06 00:00:00
- 1000个智能体打造《我的世界》,北大校友35页技术报告揭秘全新PIANO架构新的文明诞生了2024-11-05 00:00:00
- 曝字节跳动2024上半年营收同比增长35%至730亿美元左右,国际营收增长超60%2024-11-05 00:00:00
- Llama 版 o1 大模型发布:来自上海 AI Lab,强化学习代码已开源2024-11-05 00:00:00
- 20多岁少妇产子后变80岁老太,两度轻生未遂,丈夫誓死不离婚2024-11-05 00:00:00
- 在海外做“小红书” 字节可能比小红书更专业2024-11-05 00:00:00
- 7年开发经验全栈工程师!山东15岁初中生靠开源项目赚数百万2024-11-04 00:00:00
- 2024年20部灵异惊悚电影推荐,最好不要一个人看2024-11-04 00:00:00