Kokoro TTS API : Dockerised FastAPI wrapper for fast text-to-speech (Kokoro-82M model)

Derniers outils d'IAPosté il y a 6 mois Sharenet.ai

2K 0

Introduction générale

Kokoro-FastAPI est un paquetage FastAPI basé sur Docker conçu pour fournir un support au modèle de synthèse vocale Kokoro-82M. Le projet prend en charge l'accélération GPU NVIDIA et fournit le traitement de file d'attente et l'épissage automatique pour rendre la sortie vocale du texte brut plus efficace et cohérente. Le projet est développé par l'utilisateur GitHub remsky et est disponible publiquement sur GitHub. Les utilisateurs peuvent faire des demandes de synthèse vocale via l'interface API et obtenir une synthèse vocale de haute qualité pour une variété de scénarios d'application qui nécessitent une génération vocale.

Kokoro TTS API：快速文本转语音的Docker化FastAPI封装（Kokoro-82M模型）

Liste des fonctions

Fournir un paquet API pour le modèle de synthèse vocale Kokoro-82M
Prise en charge de l'accélération GPU NVIDIA pour améliorer l'efficacité de la génération vocale
Fonction de traitement des files d'attente pour prendre en charge les demandes simultanées
Fonction d'épissage automatique pour générer une sortie vocale cohérente de textes longs
Déploiement Dockerisé pour une installation et une configuration simplifiées.
Fournir des exemples de code et de la documentation aux développeurs pour qu'ils puissent commencer à travailler.

Utiliser l'aide

Processus d'installation

Assurez-vous que Docker et le support NVIDIA Docker sont installés.

Clonez le dépôt du projet Kokoro-FastAPI :

git clone https://github.com/remsky/Kokoro-FastAPI.git

Allez dans le répertoire du projet et construisez l'image Docker :
```
cd Kokoro-FastAPI
docker build -t kokoro-fastapi .
```

Démarrer le conteneur Docker :

docker run --gpus all -d -p 8000:8000 kokoro-fastapi

Utilisation de l'interface API

Accéder à la documentation de l'API :
Ouvrez votre navigateur et visitez le site http://localhost:8000/docs pour consulter la documentation de l'API et tester l'interface.
Envoi d'une demande de synthèse vocale :
Utilisez une requête POST pour envoyer un message à l'adresse/generateenvoie des données textuelles, par exemple :
```
curl -X POST "http://localhost:8000/generate" -H "accept: application/json" -H "Content-Type: application/json" -d '{"text": "你好，世界！"}'
```
Obtenir une sortie vocale :
Si la demande aboutit, l'URL du fichier vocal généré sera renvoyée et l'utilisateur pourra télécharger ou écouter le fichier.

exemple de code (informatique)

Le projet fournit des exemples de code pour aider les développeurs à démarrer rapidement :

L'exemple test_openai_tts.py montre comment effectuer une demande de synthèse vocale à l'aide de l'API.

Procédure d'utilisation détaillée

Assurez-vous que le système répond aux exigences matérielles et logicielles, en particulier les pilotes NVIDIA GPU et CUDA.
Suivez la procédure d'installation pour installer et démarrer le service Kokoro-FastAPI.
Consultez la documentation de l'API et le code d'exemple pour envoyer une demande de synthèse vocale.
Obtention de fichiers de sortie vocale, traitement et utilisation ultérieurs.

Avec les étapes ci-dessus, les utilisateurs peuvent facilement déployer et utiliser Kokoro-FastAPI pour obtenir une fonctionnalité de synthèse vocale efficace et fournir des services de génération vocale de haute qualité pour divers scénarios d'application.