Verwenden Sie Whisper, um Ihre Stimme kostenlos in mehrere Formate wortwörtlich zu transkribieren!

Praktische AI-TutorialsAktualisiert vor 5 Monaten Sharenet.ai
1K 0
Trae
使用Whisper免费将语音转录为多种格式逐字稿

 

Müssen Sie häufig Sitzungsaufzeichnungen oder Interviews in Text umwandeln? Da das Schreiben von wortwörtlichen Transkripten zeit- und arbeitsintensiv ist, möchten Sie vielleicht KI-Tools verwenden, um Audioaufnahmen in Text umzuwandeln. In diesem Artikel stellen wir Ihnen Whisper vor, ein System zur automatischen Spracherkennung (ASR) des OpenAI-Teams. Laut der Beschreibung von OpenAI auf Github ist Whisper ein Open-Source-Spracherkennungsmodell, das derzeit etwa 96 Sprachen auf der ganzen Welt erkennt und in Text umwandelt. Was die Erkennungsgenauigkeit von Chinesisch angeht, hat Whisper ein ziemlich hohes Niveau erreicht. Als Ergebnis von Flüstern Da es sich um eine Open-Source-Technologie handelt, benötigen die Nutzer lediglich ein Google-Konto und einen Befehlscode, um die Anwendung einzurichten. Sobald Sie Whisper heruntergeladen und auf Ihrem Computer installiert haben, können Sie damit kostenlos und ohne Entwicklereinschränkungen Spracherkennungs- und Transkriptionsaufgaben durchführen.

 

Whisper Installationscode:!pip install git+https://github.com/openai/whisper.git

Ffmpeg-Installationscode:!sudo apt update && sudo apt install ffmpeg

Code zur Ausführung von Sprache in Text:!whisper "文件名(需要替换).mp3" --model medium

 

Schritt 1: Melden Sie sich bei Ihrem Google-Konto an, öffnen Sie Google Drive, klicken Sie oben links auf "+Neu", scrollen Sie nach unten, um "Mehr" zu finden, und klicken Sie dann auf "Weitere Apps verbinden".

使用Whisper免费将语音转录为多种格式逐字稿

Schritt 2: Wenn Sie dies zum ersten Mal tun, wird der Google Workspace App Marketplace geöffnet. Geben Sie "Google Colaboratory" in die Suchleiste ein und wählen Sie es aus.

 

Schritt 3: Klicken Sie auf "Installieren", um die Installation durchzuführen, und wählen Sie "Weiter", um fortzufahren. Sie werden aufgefordert, sich mit Ihrem Google-Konto anzumelden und den Anweisungen zu folgen, um die Installation abzuschließen.

 

Schritt 4: Gehen Sie zurück zur Google Drive-Startseite, klicken Sie erneut auf "+Neu" in der oberen linken Ecke und wählen Sie in den weiteren Optionen die App "Google Colaboratory".

使用Whisper免费将语音转录为多种格式逐字稿

 

Schritt 5: Nach dem Öffnen können Sie den Namen der Datei ändern, um sie später schnell wiederverwenden zu können.

使用Whisper免费将语音转录为多种格式逐字稿

 

Schritt 6: Klicken Sie in der oberen Spalte auf "Ausführungsphase" und wählen Sie "Ausführungsphasentyp ändern".

使用Whisper免费将语音转录为多种格式逐字稿

 

Schritt 7: An dieser Stelle können Sie verschiedene Lauftypen und Rechenressourcen auswählen. Bitte wählen Sie "Python 3" und "T4 GPU" und klicken Sie auf "Speichern".

使用Whisper免费将语音转录为多种格式逐字稿

 

Schritt 8: Suchen Sie das Wort "Verbinden" in der oberen rechten Ecke des Fensters, klicken Sie darauf und warten Sie, bis die Verbindung erfolgreich hergestellt wurde.

使用Whisper免费将语音转录为多种格式逐字稿

 

Schritt 9: Sobald die Verbindung hergestellt ist, können Sie die Parameter des Computers sehen, einschließlich der Informationen zu Grafikprozessor, Arbeitsspeicher und Festplatte.

使用Whisper免费将语音转录为多种格式逐字稿

 

Schritt 10: Um Whisper zu installieren, geben Sie den Whisper-Installationscode und den ffmpeg-Installationscode in die erste bzw. zweite Zeile der mittleren Leiste ein und klicken Sie auf Ausführen.

使用Whisper免费将语音转录为多种格式逐字稿

 

Schritt 11: Nachdem die Installation abgeschlossen ist, klicken Sie auf das Ordnersymbol auf der linken Seite, wählen Sie "Dateien hochladen" und laden Sie die MP3-Dateien hoch, die Sie transkribieren möchten.

使用Whisper免费将语音转录为多种格式逐字稿

 

Schritt 12: Klicken Sie auf "+Code" und geben Sie den Code für die Ausführung von Sprache zu Text ein. Stellen Sie sicher, dass der Dateiname und das Suffix mit der hochgeladenen Datei übereinstimmen, und klicken Sie abschließend auf "Ausführen".

使用Whisper免费将语音转录为多种格式逐字稿
© urheberrechtliche Erklärung
AiPPT

Ähnliche Artikel

Keine Kommentare

keine
Keine Kommentare...