OmniParse
OmniParse 是一个平台,将任何非结构化数据转换为经过优化的结构化可操作数据,以用于 GenAI LLM 应用。无论是处理文档、表格、图片、视频、音频文件还是网页,OmniParse 都会准备好您的数据,使其清洁、结构化并为 AI 应用(如 RAG 微调等)做好准备。来试试吧!
列在类别中:
开发工具GitHub人工智能




描述
OmniParse是一个平台,可以将任何非结构化数据摄入并解析为优化用于GenAI LLM应用的结构化可操作数据。无论是处理文档、表格、图片、视频、音频文件还是网页,OmniParse都会准备好您的数据,使其变得干净、结构化,并且可以用于AI应用,如RAG微调等。
如何使用 OmniParse?
要使用OmniParse,您可以使用pip在基于Linux的系统上安装它。它支持各种数据类型,如文档、图片、音频、视频和网页内容。您可以使用Docker部署它,并访问由Gradio提供支持的交互式UI。
核心功能 OmniParse:
1️⃣
完全本地化,无需外部API
2️⃣
适用于T4 GPU
3️⃣
支持20种文件类型
4️⃣
将文档、多媒体和网页转换为高质量的结构化Markdown
5️⃣
表格提取、图像提取/字幕、音频/视频转录、网页爬取
为什么要使用 OmniParse?
# | 使用案例 | 状态 | |
---|---|---|---|
# 1 | 为AI应用准备数据 | ✅ | |
# 2 | 从非结构化来源中提取结构化数据 | ✅ | |
# 3 | 多媒体内容处理 | ✅ |
开发者 OmniParse?
OmniParse由Adithya S. K.创建。该项目基于Vik Paruchuri创建的Marker项目,并利用Surya OCR、Florence2和Whisper等模型进行数据处理。