Verwenden Sie Whisper, um Ihre Stimme kostenlos in mehrere Formate wortwörtlich zu transkribieren!

Praktische AI-TutorialsAktualisiert vor 6 Monaten Sharenet.ai

1.2K 0

Müssen Sie häufig Sitzungsaufzeichnungen oder Interviews in Text umwandeln? Da das Schreiben von wortwörtlichen Transkripten zeit- und arbeitsintensiv ist, möchten Sie vielleicht KI-Tools verwenden, um Audioaufnahmen in Text umzuwandeln. In diesem Artikel stellen wir Ihnen Whisper vor, ein System zur automatischen Spracherkennung (ASR) des OpenAI-Teams. Laut der Beschreibung von OpenAI auf Github ist Whisper ein Open-Source-Spracherkennungsmodell, das derzeit etwa 96 Sprachen auf der ganzen Welt erkennt und in Text umwandelt. Was die Erkennungsgenauigkeit von Chinesisch angeht, hat Whisper ein ziemlich hohes Niveau erreicht. Als Ergebnis von Flüstern Da es sich um eine Open-Source-Technologie handelt, benötigen die Nutzer lediglich ein Google-Konto und einen Befehlscode, um die Anwendung einzurichten. Sobald Sie Whisper heruntergeladen und auf Ihrem Computer installiert haben, können Sie damit kostenlos und ohne Entwicklereinschränkungen Spracherkennungs- und Transkriptionsaufgaben durchführen.

Whisper Installationscode:!pip install git+https://github.com/openai/whisper.git
Ffmpeg-Installationscode:!sudo apt update && sudo apt install ffmpeg
Code zur Ausführung von Sprache in Text:!whisper "文件名（需要替换）.mp3" --model medium

Schritt 1: Melden Sie sich bei Ihrem Google-Konto an, öffnen Sie Google Drive, klicken Sie oben links auf "+Neu", scrollen Sie nach unten, um "Mehr" zu finden, und klicken Sie dann auf "Weitere Apps verbinden".

Schritt 2: Wenn Sie dies zum ersten Mal tun, wird der Google Workspace App Marketplace geöffnet. Geben Sie "Google Colaboratory" in die Suchleiste ein und wählen Sie es aus.

Schritt 3: Klicken Sie auf "Installieren", um die Installation durchzuführen, und wählen Sie "Weiter", um fortzufahren. Sie werden aufgefordert, sich mit Ihrem Google-Konto anzumelden und den Anweisungen zu folgen, um die Installation abzuschließen.

Schritt 4: Gehen Sie zurück zur Google Drive-Startseite, klicken Sie erneut auf "+Neu" in der oberen linken Ecke und wählen Sie in den weiteren Optionen die App "Google Colaboratory".

Schritt 5: Nach dem Öffnen können Sie den Namen der Datei ändern, um sie später schnell wiederverwenden zu können.

Schritt 6: Klicken Sie in der oberen Spalte auf "Ausführungsphase" und wählen Sie "Ausführungsphasentyp ändern".

Schritt 7: An dieser Stelle können Sie verschiedene Lauftypen und Rechenressourcen auswählen. Bitte wählen Sie "Python 3" und "T4 GPU" und klicken Sie auf "Speichern".

Schritt 8: Suchen Sie das Wort "Verbinden" in der oberen rechten Ecke des Fensters, klicken Sie darauf und warten Sie, bis die Verbindung erfolgreich hergestellt wurde.

Schritt 9: Sobald die Verbindung hergestellt ist, können Sie die Parameter des Computers sehen, einschließlich der Informationen zu Grafikprozessor, Arbeitsspeicher und Festplatte.

Schritt 10: Um Whisper zu installieren, geben Sie den Whisper-Installationscode und den ffmpeg-Installationscode in die erste bzw. zweite Zeile der mittleren Leiste ein und klicken Sie auf Ausführen.

Schritt 11: Nachdem die Installation abgeschlossen ist, klicken Sie auf das Ordnersymbol auf der linken Seite, wählen Sie "Dateien hochladen" und laden Sie die MP3-Dateien hoch, die Sie transkribieren möchten.

Schritt 12: Klicken Sie auf "+Code" und geben Sie den Code für die Ausführung von Sprache zu Text ein. Stellen Sie sicher, dass der Dateiname und das Suffix mit der hochgeladenen Datei übereinstimmen, und klicken Sie abschließend auf "Ausführen".

Praktische AI-Tutorials

Der Artikel ist urheberrechtlich geschützt und darf nicht ohne Genehmigung vervielfältigt werden.

Cloudflare AI Gateway-Konfigurationshandbuch: Zentralisierung von AI-API-Aufrufdiensten

Praktische AI-Tutorials

vor 3 Monaten

0745

Ollama-Anpassung läuft auf der GPU

Praktische AI-Tutorials

vor 4 Monaten

0774

n8n Free Cloud Deployment Guide: Öffentlicher Zugang mit Hugging Face

Praktische AI-Tutorials

vor 3 Monaten

0682

7 großartige Tools zur Überprüfung von KI-generierten Inhalten

Praktische AI-Tutorials

vor 12 Monaten

01.4K

Keine Kommentare

Keine Kommentare...

Verwenden Sie Whisper, um Ihre Stimme kostenlos in mehrere Formate wortwörtlich zu transkribieren!

Schritt 1: Melden Sie sich bei Ihrem Google-Konto an, öffnen Sie Google Drive, klicken Sie oben links auf "+Neu", scrollen Sie nach unten, um "Mehr" zu finden, und klicken Sie dann auf "Weitere Apps verbinden".

Schritt 2: Wenn Sie dies zum ersten Mal tun, wird der Google Workspace App Marketplace geöffnet. Geben Sie "Google Colaboratory" in die Suchleiste ein und wählen Sie es aus.

Schritt 3: Klicken Sie auf "Installieren", um die Installation durchzuführen, und wählen Sie "Weiter", um fortzufahren. Sie werden aufgefordert, sich mit Ihrem Google-Konto anzumelden und den Anweisungen zu folgen, um die Installation abzuschließen.

Schritt 4: Gehen Sie zurück zur Google Drive-Startseite, klicken Sie erneut auf "+Neu" in der oberen linken Ecke und wählen Sie in den weiteren Optionen die App "Google Colaboratory".

Schritt 5: Nach dem Öffnen können Sie den Namen der Datei ändern, um sie später schnell wiederverwenden zu können.

Schritt 6: Klicken Sie in der oberen Spalte auf "Ausführungsphase" und wählen Sie "Ausführungsphasentyp ändern".

Schritt 7: An dieser Stelle können Sie verschiedene Lauftypen und Rechenressourcen auswählen. Bitte wählen Sie "Python 3" und "T4 GPU" und klicken Sie auf "Speichern".

Schritt 8: Suchen Sie das Wort "Verbinden" in der oberen rechten Ecke des Fensters, klicken Sie darauf und warten Sie, bis die Verbindung erfolgreich hergestellt wurde.

Schritt 9: Sobald die Verbindung hergestellt ist, können Sie die Parameter des Computers sehen, einschließlich der Informationen zu Grafikprozessor, Arbeitsspeicher und Festplatte.

Schritt 10: Um Whisper zu installieren, geben Sie den Whisper-Installationscode und den ffmpeg-Installationscode in die erste bzw. zweite Zeile der mittleren Leiste ein und klicken Sie auf Ausführen.

Schritt 11: Nachdem die Installation abgeschlossen ist, klicken Sie auf das Ordnersymbol auf der linken Seite, wählen Sie "Dateien hochladen" und laden Sie die MP3-Dateien hoch, die Sie transkribieren möchten.

Schritt 12: Klicken Sie auf "+Code" und geben Sie den Code für die Ausführung von Sprache zu Text ein. Stellen Sie sicher, dass der Dateiname und das Suffix mit der hochgeladenen Datei übereinstimmen, und klicken Sie abschließend auf "Ausführen".

Verwenden Sie Coze + Flying Book Forms, um einen automatisierten EXCEL-Tabellen-Daten-Organizer zu erstellen!

AI-Programmierung: Wie man liebenswert gut nutzt

Ähnliche Artikel

Cloudflare AI Gateway-Konfigurationshandbuch: Zentralisierung von AI-API-Aufrufdiensten

Ollama-Anpassung läuft auf der GPU

n8n Free Cloud Deployment Guide: Öffentlicher Zugang mit Hugging Face

7 großartige Tools zur Überprüfung von KI-generierten Inhalten

Keine Kommentare

Neueste Artikel

Verwenden Sie Whisper, um Ihre Stimme kostenlos in mehrere Formate wortwörtlich zu transkribieren!

Schritt 1: Melden Sie sich bei Ihrem Google-Konto an, öffnen Sie Google Drive, klicken Sie oben links auf "+Neu", scrollen Sie nach unten, um "Mehr" zu finden, und klicken Sie dann auf "Weitere Apps verbinden".

Schritt 2: Wenn Sie dies zum ersten Mal tun, wird der Google Workspace App Marketplace geöffnet. Geben Sie "Google Colaboratory" in die Suchleiste ein und wählen Sie es aus.

Schritt 3: Klicken Sie auf "Installieren", um die Installation durchzuführen, und wählen Sie "Weiter", um fortzufahren. Sie werden aufgefordert, sich mit Ihrem Google-Konto anzumelden und den Anweisungen zu folgen, um die Installation abzuschließen.

Schritt 4: Gehen Sie zurück zur Google Drive-Startseite, klicken Sie erneut auf "+Neu" in der oberen linken Ecke und wählen Sie in den weiteren Optionen die App "Google Colaboratory".

Schritt 5: Nach dem Öffnen können Sie den Namen der Datei ändern, um sie später schnell wiederverwenden zu können.

Schritt 6: Klicken Sie in der oberen Spalte auf "Ausführungsphase" und wählen Sie "Ausführungsphasentyp ändern".

Schritt 7: An dieser Stelle können Sie verschiedene Lauftypen und Rechenressourcen auswählen. Bitte wählen Sie "Python 3" und "T4 GPU" und klicken Sie auf "Speichern".

Schritt 8: Suchen Sie das Wort "Verbinden" in der oberen rechten Ecke des Fensters, klicken Sie darauf und warten Sie, bis die Verbindung erfolgreich hergestellt wurde.

Schritt 9: Sobald die Verbindung hergestellt ist, können Sie die Parameter des Computers sehen, einschließlich der Informationen zu Grafikprozessor, Arbeitsspeicher und Festplatte.

Schritt 10: Um Whisper zu installieren, geben Sie den Whisper-Installationscode und den ffmpeg-Installationscode in die erste bzw. zweite Zeile der mittleren Leiste ein und klicken Sie auf Ausführen.

Schritt 11: Nachdem die Installation abgeschlossen ist, klicken Sie auf das Ordnersymbol auf der linken Seite, wählen Sie "Dateien hochladen" und laden Sie die MP3-Dateien hoch, die Sie transkribieren möchten.

Schritt 12: Klicken Sie auf "+Code" und geben Sie den Code für die Ausführung von Sprache zu Text ein. Stellen Sie sicher, dass der Dateiname und das Suffix mit der hochgeladenen Datei übereinstimmen, und klicken Sie abschließend auf "Ausführen".

Verwenden Sie Coze + Flying Book Forms, um einen automatisierten EXCEL-Tabellen-Daten-Organizer zu erstellen!

AI-Programmierung: Wie man liebenswert gut nutzt

Ähnliche Artikel

Cloudflare AI Gateway-Konfigurationshandbuch: Zentralisierung von AI-API-Aufrufdiensten

Ollama-Anpassung läuft auf der GPU

n8n Free Cloud Deployment Guide: Öffentlicher Zugang mit Hugging Face

7 großartige Tools zur Überprüfung von KI-generierten Inhalten

Keine Kommentare

Ausgewählte AI-Tools

Neueste Artikel