新手上路 3小时前
主楼
[资源名称]
chunkr
[资源来源]
github.com
[资源介绍]
chunkr 一款文档处理开源项目,用于解决各类文档格式转换与结构化难题。支持PDF、PPT、Word、图片等多类文档处理,集成OCR文字识别与坐标提取以保留排版结构,能自动语义分块适配RAG和LLM应用,并输出HTML、Markdown、JSON等多种结构化格式,支持Docker部署和Python SDK接入。
[资源合集]
😀 😊 😵‍💫 😡 🤝 🙏 👍 👎 ❤️