Kokoro TTS API : Dockerised FastAPI wrapper for fast text-to-speech (Kokoro-82M model)
Introduction générale
Kokoro-FastAPI est un paquetage FastAPI basé sur Docker conçu pour fournir un support au modèle de synthèse vocale Kokoro-82M. Le projet prend en charge l'accélération GPU NVIDIA et fournit le traitement de file d'attente et l'épissage automatique pour rendre la sortie vocale du texte brut plus efficace et cohérente. Le projet est développé par l'utilisateur GitHub remsky et est disponible publiquement sur GitHub. Les utilisateurs peuvent faire des demandes de synthèse vocale via l'interface API et obtenir une synthèse vocale de haute qualité pour une variété de scénarios d'application qui nécessitent une génération vocale.

Liste des fonctions
- Fournir un paquet API pour le modèle de synthèse vocale Kokoro-82M
- Prise en charge de l'accélération GPU NVIDIA pour améliorer l'efficacité de la génération vocale
- Fonction de traitement des files d'attente pour prendre en charge les demandes simultanées
- Fonction d'épissage automatique pour générer une sortie vocale cohérente de textes longs
- Déploiement Dockerisé pour une installation et une configuration simplifiées.
- Fournir des exemples de code et de la documentation aux développeurs pour qu'ils puissent commencer à travailler.
Utiliser l'aide
Processus d'installation
- Assurez-vous que Docker et le support NVIDIA Docker sont installés.
- Clonez le dépôt du projet Kokoro-FastAPI :
git clone https://github.com/remsky/Kokoro-FastAPI.git
- Allez dans le répertoire du projet et construisez l'image Docker :
cd Kokoro-FastAPI docker build -t kokoro-fastapi .
- Démarrer le conteneur Docker :
docker run --gpus all -d -p 8000:8000 kokoro-fastapi
Utilisation de l'interface API
- Accéder à la documentation de l'API :
Ouvrez votre navigateur et visitez le site http://localhost:8000/docs pour consulter la documentation de l'API et tester l'interface. - Envoi d'une demande de synthèse vocale :
Utilisez une requête POST pour envoyer un message à l'adresse/generate
envoie des données textuelles, par exemple :curl -X POST "http://localhost:8000/generate" -H "accept: application/json" -H "Content-Type: application/json" -d '{"text": "你好,世界!"}'
- Obtenir une sortie vocale :
Si la demande aboutit, l'URL du fichier vocal généré sera renvoyée et l'utilisateur pourra télécharger ou écouter le fichier.
exemple de code (informatique)
Le projet fournit des exemples de code pour aider les développeurs à démarrer rapidement :
- L'exemple test_openai_tts.py montre comment effectuer une demande de synthèse vocale à l'aide de l'API.
Procédure d'utilisation détaillée
- Assurez-vous que le système répond aux exigences matérielles et logicielles, en particulier les pilotes NVIDIA GPU et CUDA.
- Suivez la procédure d'installation pour installer et démarrer le service Kokoro-FastAPI.
- Consultez la documentation de l'API et le code d'exemple pour envoyer une demande de synthèse vocale.
- Obtention de fichiers de sortie vocale, traitement et utilisation ultérieurs.
Avec les étapes ci-dessus, les utilisateurs peuvent facilement déployer et utiliser Kokoro-FastAPI pour obtenir une fonctionnalité de synthèse vocale efficace et fournir des services de génération vocale de haute qualité pour divers scénarios d'application.
© déclaration de droits d'auteur
L'article est protégé par le droit d'auteur et ne doit pas être reproduit sans autorisation.
Articles connexes
Pas de commentaires...