Open NotebookLM: PDF in Podcasts von Open-Source-Tools konvertieren

Neueste AI-ToolsGeschrieben vor 4 Monaten Sharenet.ai
973 0
Trae

Allgemeine Einführung

Öffnen Sie NotebookLM ist ein Open-Source-Projekt zur Umwandlung beliebiger PDF-Dokumente in einen Podcast. Das Tool verwendet quelloffene Large Language Models (LLM) und Text-to-Speech (TTS)-Modelle, um PDF-Inhalte zu verarbeiten, natürliche Dialoge zu generieren, die für Audio-Podcasts geeignet sind, und sie in MP3-Dateien auszugeben. Inspiriert durch das NotebookLM-Tool, nutzt das Projekt Technologien wie Llama 3.3 70B, Fireworks AI, MeloTTS, Bark und Jina Reader. Benutzer können PDF-Dokumente über eine einfache Schnittstelle hochladen, um informative und interessante Podcast-Dialoge zu erstellen.

Open NotebookLM:将PDF转换为播客的开源工具

 

Funktionsliste

  • PDF zu PodcastHochladen eines PDF-Dokuments, um dessen Inhalt in einen Podcast-Dialog zu konvertieren.
  • Natürliche DialoggenerierungErstellen Sie informative Dialoge, die sowohl lehrreich als auch unterhaltsam sein sollen.
  • benutzerfreundliche SchnittstelleGradio: Verwenden Sie Gradio, um eine einfache interaktive Schnittstelle bereitzustellen.
  • Unterstützung mehrerer SprachenPodcast-Erstellung in 13 Sprachen wird unterstützt.

 

Hilfe verwenden

Einbauverfahren

  1. Klon-Lagerhaus:
   git clone https://github.com/gabrielchua/open-notebooklm.git
cd open-notebooklm
  1. Erstellen Sie eine virtuelle Umgebung und aktivieren Sie sie:
   python -m venv .venv
source .venv/bin/activate
  1. Installieren Sie die erforderlichen Pakete:
   pip install -r requirements.txt

Verwendungsprozess

  1. Legen Sie den API-Schlüssel fest:
    • Festlegen des Fireworks-API-Schlüssels als UmgebungsvariableFIREWORKS_API_KEY.
  2. Führen Sie die Anwendung aus:
   python app.py

Dadurch wird die Gradio-Schnittstelle gestartet.

  1. PDF hochladen:
    • Laden Sie das PDF-Dokument, das Sie in einen Podcast umwandeln möchten, in die Schnittstelle hoch.
  2. Erzeugen Sie Audio:
    • Klicken Sie auf die Schaltfläche, um den Konvertierungsprozess zu starten. Die Ausgabe ist eine MP3-Datei, die den Podcast-Dialog enthält.

Detaillierte Funktionsabläufe

  1. PDF-UploadPDF-Dateien in der Gradio-Oberfläche auswählen und hochladen.
  2. Erzeugung von DialogenDas System verarbeitet automatisch PDF-Inhalte, um einen natürlichen Dialog zu erzeugen.
  3. AudioausgangKlicken Sie auf die Schaltfläche Erzeugen und das System wird die Podcast-Datei im MP3-Format ausgeben.
  4. Unterstützung mehrerer SprachenWählen Sie in den Einstellungen die gewünschte Sprache aus, und das System erstellt den Podcast in der entsprechenden Sprache entsprechend der Auswahl.
© urheberrechtliche Erklärung
AiPPT

Ähnliche Artikel

Keine Kommentare

keine
Keine Kommentare...