新手上路 3小时前
主楼
[资源名称]
PRIME
[资源来源]
github.com
[资源介绍]
PRIME 一个基于强化学习技术的AI项目PRIME,仅用8张显卡短时间内训练出7B模型,在数学推理能力上超越GPT-4o及Llama-3.1 70B,还提出能在不依赖高质量数据的情况下显著提升模型推理能力的算法。
[资源合集]
😀 😊 😵‍💫 😡 🤝 🙏 👍 👎 ❤️