EMO : Générer des vidéos de portraits de haute qualité à partir d'images de portraits et de voix humaines.

Derniers outils d'IAPosté il y a 7 mois Sharenet.ai
1.2K 0
吐司AI

Introduction générale

Yummy Portrait EMO est un outil de génération de vidéos dynamiques de haute qualité fourni par Hundred Refine (Model Studio), une grande plateforme de services de modèles d'AliCloud. Cet outil se base sur des images de portraits et des fichiers audio de voix humaines pour générer des vidéos dynamiques de portraits réalistes. Joyful Portrait EMO contient deux modèles indépendants : "Joyful Portrait EMO-detect" et "Joyful Portrait EMO", qui sont utilisés respectivement pour la détection de la conformité des images de personnages et la génération de vidéos de personnages. Les utilisateurs peuvent rapidement générer des vidéos de portraits de personnages de haute qualité conformes aux spécifications par le biais de simples appels API, qui conviennent à une variété de scénarios d'application, tels que les présentateurs virtuels, les personnes numériques, etc.

Faites-en l'expérience gratuitement dans l'application Tongyi. Une commercialisation formelle est possible par le biais d'appels API ou d'un auto-déploiement sur la plateforme Ali Bailian.

悦动人像EMO:基于人物肖像图片和人声音频生成高质量人物肖像动态视频

 

Liste des fonctions

  • Détection de la conformité de l'image des caractèresDétection de l'image : utiliser le modèle "EMO-detect" pour détecter si l'image d'entrée est conforme à la spécification.
  • Génération de vidéos de personnagesLe modèle "EMO Portrait" permet de générer une vidéo dynamique à partir d'une image de portrait et d'un fichier audio vocal.
  • Différents styles au choixLe système d'alerte est un système d'alerte qui prend en charge une large gamme d'intensités de mouvement telles que l'animation, la modération et la tranquillité.
  • Appel APILe système de gestion de l'information : il fournit une interface API facile à utiliser pour que les développeurs puissent l'intégrer.
  • déploiement autonomeLe système de gestion de l'information (SGI) est un système de gestion de l'information qui prend en charge le déploiement indépendant du modèle pour les exigences de concurrence élevées.

 

Utiliser l'aide

Installation et configuration

  1. Service ouvertPour ce faire, vous devez tout d'abord ouvrir le service Joyful Portrait EMO sur la plateforme AliCloud et obtenir la clé API.
  2. Obtenir la clé de l'APIPour obtenir la clé API, connectez-vous à votre compte AliCloud et entrez dans la plateforme de service de grands modèles, Hundred Refine.

Étapes d'utilisation

  1. Appel du modèle de détection d'images: :
    • Le modèle "EMO-detect" est utilisé pour détecter si l'image d'entrée est conforme à la spécification.
    • Exemple d'appel API :
     import requests
    url = "https://api.aliyun.com/emo-detect"
    headers = {"Authorization": "Bearer YOUR_API_KEY"}
    data = {"image": "base64_encoded_image"}
    response = requests.post(url, headers=headers, json=data)
    print(response.json())
    
  2. Appeler le modèle de génération vidéo: :
    • À l'aide du modèle "Yummy Portrait EMO", saisissez les images de portrait détectées et les fichiers audio vocaux pour générer une vidéo animée.
    • Exemple d'appel API :
     import requests
    url = "https://api.aliyun.com/emo"
    headers = {"Authorization": "Bearer YOUR_API_KEY"}
    data = {
    "image": "base64_encoded_image",
    "audio": "base64_encoded_audio",
    "style_level": "active"
    }
    response = requests.post(url, headers=headers, json=data)
    print(response.json())
    

déploiement autonome

  1. Achat de ressourcesLes services d'instance : Achetez des ressources d'instance exclusives sur la plateforme AliCloud.
  2. modèle de déploiementLes modèles "EMO-detect-deployment" et "EMO-deployment" sont déployés respectivement.
  3. invoquer le modèle de déploiement: :
    • Appeler le modèle "EMO-detect-deployment" pour la détection d'images.
    • Appeler le modèle "EMO-deployment" pour la génération de vidéos.

 

Droits de douane et restrictions sur les flux

paradigmeNom du modèleprix de l'articlequota libreInterface Task-Down Limite QPSNombre de tâches en traitement simultané
appel de modèleemo-detect-v1Modèle d'appel, postpayé :

0,004 yuan par feuille

200 feuilles

Période de validité : 180 jours après l'ouverture des cent raffineries.

5Interfaces de synchronisation illimitées
emo-v1Modèle d'appel, postpayé :

  • Générer une vidéo à l'échelle 1:1 : 0,08 $/seconde
  • Générer une vidéo au format 3:4 : 0,16 $/seconde
1800 secondes.

Période de validité : 180 jours après l'ouverture des cent raffineries.

1

(Au même moment, un seul travail est en cours d'exécution et les autres travaux de la file d'attente sont en attente).

Déploiement du modèleemo-detectLes modèles sont déployés de manière indépendante et prépayés :

  • 10 000 $/unité de calcul/mois
  • 20 $/unité de calcul/heure

Doit être invoqué après un déploiement réussi, seuls les frais de déploiement seront facturés.

ne pas avoir51 unité arithmétique supporte 5 concurrences
émo1 unité arithmétique supporte 1 concurrence

 

mise en garde

  • Droits de douane et restrictions sur les fluxLe paiement est basé sur l'utilisation, veuillez vous référer à la documentation officielle d'AliCloud pour les tarifs spécifiques.
  • limite de concurrenceLes unités arithmétiques : En fonction de l'unité arithmétique achetée, différents nombres de tâches simultanées sont pris en charge.
© déclaration de droits d'auteur
AiPPT

Postes connexes

Pas de commentaires

aucun
Pas de commentaires...