新手上路 3小时前
主楼
[资源名称]
rllm
[资源来源]
github.com
[资源介绍]
rllm 一款用于语言模型强化学习训练的开源框架,可快速构建、训练和部署基于RL后训练的语言智能体,提供高性能开源模型与训练脚本,支持自定义环境与智能体,适配RLHF、GRPO等多种RL算法,并具备完整评测与日志记录功能。
[资源合集]
😀 😊 😵‍💫 😡 🤝 🙏 👍 👎 ❤️