EMO : Générer des vidéos de portraits de haute qualité à partir d'images de portraits et de voix humaines.

Derniers outils d'IAPosté il y a 7 mois Sharenet.ai

1.2K 0

Introduction générale

Yummy Portrait EMO est un outil de génération de vidéos dynamiques de haute qualité fourni par Hundred Refine (Model Studio), une grande plateforme de services de modèles d'AliCloud. Cet outil se base sur des images de portraits et des fichiers audio de voix humaines pour générer des vidéos dynamiques de portraits réalistes. Joyful Portrait EMO contient deux modèles indépendants : "Joyful Portrait EMO-detect" et "Joyful Portrait EMO", qui sont utilisés respectivement pour la détection de la conformité des images de personnages et la génération de vidéos de personnages. Les utilisateurs peuvent rapidement générer des vidéos de portraits de personnages de haute qualité conformes aux spécifications par le biais de simples appels API, qui conviennent à une variété de scénarios d'application, tels que les présentateurs virtuels, les personnes numériques, etc.

Faites-en l'expérience gratuitement dans l'application Tongyi. Une commercialisation formelle est possible par le biais d'appels API ou d'un auto-déploiement sur la plateforme Ali Bailian.

Liste des fonctions

Détection de la conformité de l'image des caractèresDétection de l'image : utiliser le modèle "EMO-detect" pour détecter si l'image d'entrée est conforme à la spécification.
Génération de vidéos de personnagesLe modèle "EMO Portrait" permet de générer une vidéo dynamique à partir d'une image de portrait et d'un fichier audio vocal.
Différents styles au choixLe système d'alerte est un système d'alerte qui prend en charge une large gamme d'intensités de mouvement telles que l'animation, la modération et la tranquillité.
Appel APILe système de gestion de l'information : il fournit une interface API facile à utiliser pour que les développeurs puissent l'intégrer.
déploiement autonomeLe système de gestion de l'information (SGI) est un système de gestion de l'information qui prend en charge le déploiement indépendant du modèle pour les exigences de concurrence élevées.

Utiliser l'aide

Installation et configuration

Service ouvertPour ce faire, vous devez tout d'abord ouvrir le service Joyful Portrait EMO sur la plateforme AliCloud et obtenir la clé API.
Obtenir la clé de l'APIPour obtenir la clé API, connectez-vous à votre compte AliCloud et entrez dans la plateforme de service de grands modèles, Hundred Refine.

Étapes d'utilisation

Appel du modèle de détection d'images: :

Le modèle "EMO-detect" est utilisé pour détecter si l'image d'entrée est conforme à la spécification.
Exemple d'appel API :

 import requests
url = "https://api.aliyun.com/emo-detect"
headers = {"Authorization": "Bearer YOUR_API_KEY"}
data = {"image": "base64_encoded_image"}
response = requests.post(url, headers=headers, json=data)
print(response.json())

Appeler le modèle de génération vidéo: :

À l'aide du modèle "Yummy Portrait EMO", saisissez les images de portrait détectées et les fichiers audio vocaux pour générer une vidéo animée.
Exemple d'appel API :

 import requests
url = "https://api.aliyun.com/emo"
headers = {"Authorization": "Bearer YOUR_API_KEY"}
data = {
"image": "base64_encoded_image",
"audio": "base64_encoded_audio",
"style_level": "active"
}
response = requests.post(url, headers=headers, json=data)
print(response.json())

déploiement autonome

Achat de ressourcesLes services d'instance : Achetez des ressources d'instance exclusives sur la plateforme AliCloud.
modèle de déploiementLes modèles "EMO-detect-deployment" et "EMO-deployment" sont déployés respectivement.
invoquer le modèle de déploiement: :
- Appeler le modèle "EMO-detect-deployment" pour la détection d'images.
- Appeler le modèle "EMO-deployment" pour la génération de vidéos.

Droits de douane et restrictions sur les flux

paradigme	Nom du modèle	prix de l'article	quota libre	Interface Task-Down Limite QPS	Nombre de tâches en traitement simultané
appel de modèle	emo-detect-v1	Modèle d'appel, postpayé : 0,004 yuan par feuille	200 feuilles Période de validité : 180 jours après l'ouverture des cent raffineries.	5	Interfaces de synchronisation illimitées
appel de modèle	emo-v1	Modèle d'appel, postpayé : Générer une vidéo à l'échelle 1:1 : 0,08 $/seconde Générer une vidéo au format 3:4 : 0,16 $/seconde	1800 secondes. Période de validité : 180 jours après l'ouverture des cent raffineries.	5	1 (Au même moment, un seul travail est en cours d'exécution et les autres travaux de la file d'attente sont en attente).
Déploiement du modèle	emo-detect	Les modèles sont déployés de manière indépendante et prépayés : 10 000 $/unité de calcul/mois 20 $/unité de calcul/heure Doit être invoqué après un déploiement réussi, seuls les frais de déploiement seront facturés.	ne pas avoir	5	1 unité arithmétique supporte 5 concurrences
Déploiement du modèle	émo		ne pas avoir	5	1 unité arithmétique supporte 1 concurrence

mise en garde

Droits de douane et restrictions sur les fluxLe paiement est basé sur l'utilisation, veuillez vous référer à la documentation officielle d'AliCloud pour les tarifs spécifiques.
limite de concurrenceLes unités arithmétiques : En fonction de l'unité arithmétique achetée, différents nombres de tâches simultanées sont pris en charge.