快速开始¶
这一部分保持最小化。Agent-R1 与 verl 使用相同的运行环境要求,因此这里不重复完整基础设施文档,而是帮助你尽快跑通一个可工作的 Agent-R1 设置。
本节内容¶
安装指南:使用官方verl环境,并确认 Agent-R1 需要继承哪些设置。Quick Start:下载处理好的数据集,或准备一个小型 GSM8K 数据集,并运行单步 sanity check 脚本。
推荐路径¶
- 按照
verl安装指南配置环境。 - 从 ModelScope 下载处理好的数据集,或本地重新生成最小 GSM8K 数据用于快速检查。
- 运行单步 sanity check,确认模型路径、依赖与训练栈已经连通。
- 环境稳定后,再进入智能体任务教程。