蚂蚁集团联合清华大学发布开源强化学习训练框架 AReaL v1.0 稳定版3 月 4 日，蚂蚁集团联合清华大学发布开源强化学习训练框架 AReaL v1.0 稳定版

蚂蚁集团联合清华大学发布开源强化学习训练框架 AReaL v1.0 稳定版
3 月 4 日，蚂蚁集团联合清华大学发布开源强化学习训练框架 AReaL v1.0 稳定版。该版本主打“Agent 一键接入 RL 训练”：不用改代码，兼容各类 Agent 框架，让智能体强化学习训练开箱即用。AReaL 是首个全异步训推解耦的大模型强化学习训练系统，能让 Agent 在真实任务交互中获得反馈、持续优化决策。此次发布的 v1.0 版本让任意 Agent 零改造接入 RL 训练成为现实——通过在智能体与训练系统之间加入 Proxy Worker 中转层，开发者只需修改一个请求地址即可接入训练。（科创板日报）