新手上路 3小时前
主楼
[资源名称]
evaluation-guidebook
[资源来源]
github.com
[资源介绍]
evaluation-guidebook 一份系统性的LLM评估指南。涵盖自动化基准测试、人工评估和LLM-as-a-judge三大主流方法,提供实践经验、故障排查技巧及评估方案设计,内容按难度分层并支持中文和法语社区翻译版本。
[资源合集]
😀 😊 😵‍💫 😡 🤝 🙏 👍 👎 ❤️