新手上路 3小时前
主楼
[资源名称]
verifiers
[资源来源]
github.com
[资源介绍]
verifiers 一款面向AI开发者的LLM强化学习模块化组件库。提供完整的环境构建方案,支持单轮、多轮及工具调用场景,内置异步GRPO训练器优化多GPU效率,可无缝接入vLLM等推理服务并支持灵活评估系统与自定义奖励函数。
[资源合集]
😀 😊 😵‍💫 😡 🤝 🙏 👍 👎 ❤️