OmniParse: Extrahiert beliebige unstrukturierte Daten aus Dokumenten/Multimedia und parst sie in strukturierte Daten

Neueste AI-ToolsAktualisiert vor 8 Monaten Sharenet.ai

1.4K 0

Allgemeine Einführung

OmniParse ist eine leistungsstarke Plattform zum Parsen und Optimieren von Daten, mit der unstrukturierte Daten in strukturierte, verwertbare Daten umgewandelt werden können, die für GenAI-Frameworks (Generative Artificial Intelligence) optimiert sind. Ob Sie mit Dokumenten, Tabellen, Bildern, Videos, Audiodateien oder Webinhalten arbeiten, OmniParse macht Ihre Daten sauber, strukturiert und bereit für KI-Anwendungen wie RAG (Retrieval Augmented Generation) und Feinabstimmung.

: Open-Source-Demo-Adresse: https://colab.research.google.com/github/adithya-s-k/omniparse/blob/main/examples/OmniParse_GoogleColab.ipynb

Funktionsliste

Vollständig lokalisiert, keine externe API erforderlich
Für T4-GPUs
Unterstützt etwa 20 Dateitypen
Konvertierung von Dokumenten, Multimedia und Webseiten in hochwertiges strukturiertes Markdown
Tabellenextraktion, Bildextraktion/Untertitelung, Audio-/Videotranskription, Webcrawling
Einfache Bereitstellung mit Docker und Skypilot
Freundliche Colab-Umgebung
Interaktive Benutzeroberfläche mit Gradio

Hilfe verwenden

Einbauverfahren

Klon-Lager::

git clone https://github.com/adithya-s-k/omniparse
cd omniparse

Erstellen einer virtuellen Umgebung::

conda create -n omniparse-venv python=3.10
conda activate omniparse-venv

Installation von Abhängigkeiten::

poetry install
# 或者
pip install -e .
# 或者
pip install -r pyproject.toml

Docker verwenden

Abrufen von OmniParse API-Images von Docker Hub::
```
docker pull savatar101/omniparse:0.1
```

Starten Sie den Docker-Container und geben Sie Port 8000 frei.::

# 如果使用GPU
docker run --gpus all -p 8000:8000 savatar101/omniparse:0.1
# 否则
docker run -p 8000:8000 savatar101/omniparse:0.1

Operationsserver

Starten Sie den Server::
```
python server.py --host 0.0.0.0 --port 8000 --documents --media --web
```
- --documentsLaden aller Modelle, die beim Parsen und Einlesen von Dokumenten helfen (z. B. die Surya OCR-Modellfamilie und Florence-2).
- --mediaLaden Sie Whisper-Modelle, um Audio- und Videodateien zu transkribieren.
- --webEinrichten des Selenium-Crawlers.

Unterstützte Datentypen

(Computer-)Datei::.doc, .docx, .pdf, .ppt, .pptx
Bildmaterial::.png, .jpg, .jpeg, .tiff, .bmp, .heic
Video::.mp4, .mkv, .avi, .mov
Tonfrequenz::.mp3, .wav, .aac
Web-Seite: dynamische Webseiten.http://.com

Anwendungsbeispiel

Dokumentenauflösung::
```
python server.py --host 0.0.0.0 --port 8000 --documents
```
Dadurch werden alle Modelle für das Parsen von Dokumenten geladen, die bereit sind, Daten des Dokumenttyps zu verarbeiten.
Multimedia-Parsing::
```
python server.py --host 0.0.0.0 --port 8000 --media
```
Dadurch wird das Whisper-Modell geladen und ist bereit, Audio- und Videodateien zu verarbeiten.
Web-Crawler::
```
python server.py --host 0.0.0.0 --port 8000 --web
```
Dadurch wird der Selenium-Crawler eingerichtet und ist bereit, Webinhalte zu verarbeiten.

Neueste AI-Tools # AI Java Open Source Projekt # Extraktion und Reinigung von Dokumenten

Der Artikel ist urheberrechtlich geschützt und darf nicht ohne Genehmigung vervielfältigt werden.

Artbreeder: Hervorragende Bildkontrolle und Bildstilüberblendung für den Unterricht!

Neueste AI-Tools # AI Image Style Control # AI Online-Bilderzeugung # AI Gesichtstausch und Verkleidung

vor 1 Monat

01.7K

AingDesk: Ein-Klick-Installation von KI-Modellen und Chat-Schnittstellen auf Personal Computern (mit DeepSeek)

Neueste AI-Tools # AI Java Open Source Projekt # AI Lokalisierte Chat-Anwendung

vor 5 Monaten

0962

LoveyDovey: eine KI-App für romantische Unterhaltungen mit virtuellen Figuren

Neueste AI-Tools # AI-Rollenspiel

vor 2 Monaten

0603

Flying Paddle PP-TableMagic: Strukturierte Informationsextraktion für komplexe Tabellen

Neueste AI-Tools # AI Java Open Source Projekt # Extraktion und Reinigung von Dokumenten

vor 4 Monaten

0949

Keine Kommentare

Keine Kommentare...

OmniParse: Extrahiert beliebige unstrukturierte Daten aus Dokumenten/Multimedia und parst sie in strukturierte Daten

Allgemeine Einführung

Funktionsliste

Hilfe verwenden

Einbauverfahren

Docker verwenden

Operationsserver

Unterstützte Datentypen

Anwendungsbeispiel

Video Ocean: Erzeugen Sie Videos aus Text oder Bildern, die die Gesichter der Personen in der Schlange festhalten.

Smart Spectrum Clearstream: ein Big-Model-Anwendungszentrum der Unternehmensklasse, das eine intelligente KI-Entwicklungsplattform bietet

Ähnliche Artikel

Artbreeder: Hervorragende Bildkontrolle und Bildstilüberblendung für den Unterricht!

AingDesk: Ein-Klick-Installation von KI-Modellen und Chat-Schnittstellen auf Personal Computern (mit DeepSeek)

LoveyDovey: eine KI-App für romantische Unterhaltungen mit virtuellen Figuren

Flying Paddle PP-TableMagic: Strukturierte Informationsextraktion für komplexe Tabellen

Keine Kommentare

Neueste Artikel

OmniParse: Extrahiert beliebige unstrukturierte Daten aus Dokumenten/Multimedia und parst sie in strukturierte Daten

Allgemeine Einführung

Funktionsliste

Hilfe verwenden

Einbauverfahren

Docker verwenden

Operationsserver

Unterstützte Datentypen

Anwendungsbeispiel

Video Ocean: Erzeugen Sie Videos aus Text oder Bildern, die die Gesichter der Personen in der Schlange festhalten.

Smart Spectrum Clearstream: ein Big-Model-Anwendungszentrum der Unternehmensklasse, das eine intelligente KI-Entwicklungsplattform bietet

Ähnliche Artikel

Artbreeder: Hervorragende Bildkontrolle und Bildstilüberblendung für den Unterricht!

AingDesk: Ein-Klick-Installation von KI-Modellen und Chat-Schnittstellen auf Personal Computern (mit DeepSeek)

LoveyDovey: eine KI-App für romantische Unterhaltungen mit virtuellen Figuren

Flying Paddle PP-TableMagic: Strukturierte Informationsextraktion für komplexe Tabellen

Keine Kommentare

Ausgewählte AI-Tools

Neueste Artikel