Pyramid Flow: uma versão de código aberto do "Kringle" lançada pela Racer, baseada no SD3 e executada em GPUs com menos de 8 GB (versão de implantação com um clique)

Ferramentas de IA mais recentesAtualizado há 8 meses Sharenet.ai

1.3K 0

Introdução geral

O Pyramid Flow é um método eficiente de geração de vídeo autorregressivo baseado na técnica Flow Matching. O método permite a geração e a descompressão de conteúdo de vídeo com maior eficiência computacional por meio da interpolação entre diferentes resoluções e níveis de ruído. O Pyramid Flow é capaz de gerar vídeos de 10 segundos de alta qualidade com resolução de 768p a 24 FPS e oferece suporte à geração de imagem para vídeo. Toda a estrutura é otimizada de ponta a ponta, usando um único modelo DiT, treinado em 20,7 mil horas de treinamento da GPU A100.

$Pyramid Flow：快手推出的开源版\$

Experiência on-line: https://huggingface.co/spaces/Pyramid-Flow/pyramid-flow

Lista de funções

Geração eficiente de vídeoGera vídeo de 10 segundos de alta qualidade com resolução de 768p a 24 FPS.
Geração de imagem para vídeoSuporte para geração de vídeo a partir de imagens.
Suporte a várias resoluções: Os pontos de verificação do modelo estão disponíveis nas resoluções 768p e 384p.
Descarga da CPUDescarregamento da CPU: Há suporte para dois tipos de descarregamento da CPU para reduzir os requisitos de memória da GPU.
Suporte a várias GPUsScripts de inferência de várias GPUs: fornece scripts de inferência de várias GPUs que suportam paralelismo de sequência para economizar memória por GPU.

Usando a Ajuda

Configurações ambientais

Use o conda para criar um ambiente:

cd Pyramid-Flow
conda create --name pyramid-flow python=3.8.10
conda activate pyramid-flow

Instale a dependência:
```
pip install -r requirements.txt
```

Download e carregamento de modelos

Faça o download dos pontos de controle do modelo no Huggingface:
```
# 下载 768p 和 384p 模型检查点
```

Modelos de carregamento:

model_dtype, torch_dtype = 'bf16', torch.bfloat16
model = PyramidDiTForVideoGeneration(
    'PATH',  # 下载的检查点目录
    model_dtype,
    model_variant='diffusion_transformer_768p',  # 或 'diffusion_transformer_384p'
)
model.vae.enable_tiling()
model.enable_sequential_cpu_offload()

Geração de texto para vídeo

Defina os parâmetros de geração e gere o vídeo:

frames = model.generate(
    prompt="你的文本提示",
    num_inference_steps=[20, 20, 20],
    video_num_inference_steps=[10, 10, 10],
    height=768,
    width=1280,
    temp=16,  # temp=16: 5s, temp=31: 10s
    guidance_scale=9.0,  # 384p 设为 7
    video_guidance_scale=5.0,
    output_type="pil",
    save_memory=True,
)
export_to_video(frames, "./text_to_video_sample.mp4", fps=24)

Geração de imagem para vídeo

Defina os parâmetros de geração e gere o vídeo:

prompt = "FPV flying over the Great Wall"
with torch.no_grad(), torch.cuda.amp.autocast(enabled=True, dtype=torch_dtype):
    frames = model.generate_i2v(
        prompt=prompt,
        input_image=image,
        num_inference_steps=[10, 10, 10],
        temp=16,
        video_guidance_scale=4.0,
        output_type="pil",
        save_memory=True,
    )
export_to_video(frames, "./image_to_video_sample.mp4", fps=24)

Inferência multi-GPU

Inferência usando várias GPUs:

# 在 2 个或 4 个 GPU 上运行推理脚本

Niu One Click Deployment Edition

O código de descriptografia do arquivo de inicialização é colocado no endereço de download. Se o download do modelo for interrompido com frequência após a inicialização, consulte o documento oficial para fazer o download do arquivo do modelo separadamente, que tem cerca de 30 G.

文件解压密码：niugee.com
通过网盘分享的文件：PyramidFlow-牛哥免部署本地一键包
链接: https://pan.baidu.com/s/1yV4wafDkquBNwG8bS0zjDg?pwd=p5fw 提取码: p5fw （新版1.1)

Google Drive：
https://drive.google.com/drive/u/1/folders/1SIvP6qP2Z4CRHpbsfXawl3tksv5ZBRGo （新版1.1)

Ferramentas de IA mais recentes # AI Imagem para vídeo # Projeto de código aberto AI Java

O artigo é protegido por direitos autorais e não deve ser reproduzido sem permissão.

AnimateAI: Gere vídeos animados consistentes com os personagens usando IA, ferramenta de geração de vídeos animados para crianças

Ferramentas de IA mais recentes # AI Imagem para vídeo Ferramenta de geração de vídeo # AI

7 meses atrás

01.7K

Folk: usando IA para otimizar o gerenciamento do relacionamento com o cliente

Ferramentas de IA mais recentes # AI Marketing

6 meses atrás

01.1K

XAnswer: mecanismo de pesquisa inteligente de IA com respostas instantâneas e mapas mentais

Ferramentas de IA mais recentes Ferramenta de busca # AI

8 meses atrás

01.4K

Lovable（GPT Engineer）：一站式AI软件工程师，快速构建网站和应用代码

Lovable (GPT Engineer): engenheiro de software de IA em um só lugar para criar rapidamente códigos de sites e aplicativos

Ferramentas de IA mais recentes Programação de IA #

1 mês atrás

02.2K

Sem comentários

Nenhum comentário...

Pyramid Flow: uma versão de código aberto do "Kringle" lançada pela Racer, baseada no SD3 e executada em GPUs com menos de 8 GB (versão de implantação com um clique)

Introdução geral

Lista de funções

Usando a Ajuda

Configurações ambientais

Download e carregamento de modelos

Geração de texto para vídeo

Geração de imagem para vídeo

Inferência multi-GPU

Niu One Click Deployment Edition

Aidge Intelligent Translation Platform (Marco MT): tradução de materiais de comércio eletrônico, soluções de localização de conteúdo

Pieces for Developers: memória de longo prazo de trechos de código em desenvolvimento, assistente de IA fornece sugestões inteligentes com base na memória

Artigos relacionados

AnimateAI: Gere vídeos animados consistentes com os personagens usando IA, ferramenta de geração de vídeos animados para crianças

Folk: usando IA para otimizar o gerenciamento do relacionamento com o cliente

XAnswer: mecanismo de pesquisa inteligente de IA com respostas instantâneas e mapas mentais

Lovable (GPT Engineer): engenheiro de software de IA em um só lugar para criar rapidamente códigos de sites e aplicativos

Sem comentários

Artigos mais recentes

Pyramid Flow: uma versão de código aberto do "Kringle" lançada pela Racer, baseada no SD3 e executada em GPUs com menos de 8 GB (versão de implantação com um clique)

Introdução geral

Lista de funções

Usando a Ajuda

Configurações ambientais

Download e carregamento de modelos

Geração de texto para vídeo

Geração de imagem para vídeo

Inferência multi-GPU

Niu One Click Deployment Edition

Aidge Intelligent Translation Platform (Marco MT): tradução de materiais de comércio eletrônico, soluções de localização de conteúdo

Pieces for Developers: memória de longo prazo de trechos de código em desenvolvimento, assistente de IA fornece sugestões inteligentes com base na memória

Artigos relacionados

AnimateAI: Gere vídeos animados consistentes com os personagens usando IA, ferramenta de geração de vídeos animados para crianças

Folk: usando IA para otimizar o gerenciamento do relacionamento com o cliente

XAnswer: mecanismo de pesquisa inteligente de IA com respostas instantâneas e mapas mentais

Lovable (GPT Engineer): engenheiro de software de IA em um só lugar para criar rapidamente códigos de sites e aplicativos

Sem comentários

Ferramentas de IA selecionadas

Artigos mais recentes