SHMT:自监督分层化妆转移模型,虚拟化妆,将妆容迁移到新的人像中

SHMT: modelo hierárquico autossupervisionado de transferência de maquiagem, maquiagem virtual, migração de maquiagem para novos retratos

Introdução abrangente O SHMT (Self-supervised Hierarchical Makeup Transfer) é um projeto de migração de maquiagem hierárquica autossupervisionada baseado em um modelo de difusão latente, com o objetivo de obter efeitos de maquiagem de alta qualidade por meio de métodos de aprendizagem não supervisionados...
5 meses atrás
01.1K
VITA:开源视觉与语音实时交互的多模态大语言模型

VITA: Modelos de linguagem multimodal de grande porte de código aberto para interação visual e de fala em tempo real

综合介绍 VITA是一个领先的开源交互式多模态大语言模型项目,率先实现了真正的全方位多模态交互能力。该项目于2024年8月推出VITA-1.0版本,开创了首个开源交互式全模态大语言模型的先河。2024...
5 meses atrás
01.3K
AI no jimaku gumi:借助AI实现视频多语言字幕自动生成和翻译

AI no jimaku gumi: geração e tradução automáticas de legendas multilíngues para vídeos com a ajuda da IA

Introdução geral O AI no jimaku gumi (AI no subtitle group) é uma poderosa ferramenta de processamento de legendas de vídeo de linha de comando, cujo foco é permitir funções automatizadas de extração, transcrição e tradução de legendas de vídeo. A ferramenta integra tecnologias avançadas de IA, incluindo a fala Whisper...
5 meses atrás
01.1K
TransRouter:基于Gemini多模态模型,实时中英互译的音频转换工具

TransRouter: uma ferramenta de conversão de áudio em tempo real para tradução de chinês para inglês com base no modelo multimodal Gemini

综合介绍 TransRouter 是一个基于 Google Gemini 大模型的实时语音翻译工具,专门设计用于实现中英文之间的实时语音互译。该工具能够无缝集成到 Zoom 等视频会议软件中,为跨语言...
5 meses atrás
01K
opensource_notebooklm:基于Deepseek-V3和PlayHT TTS的NotebookLM开源实现

opensource_notebooklm: implementação de código aberto do NotebookLM com base no Deepseek-V3 e no PlayHT TTS

Introdução geral O Open Source NotebookLM é um projeto inovador de inteligência artificial que combina os recursos de compreensão de linguagem do Deepseek-V3 com a tecnologia de síntese de fala do PlayHT, com o objetivo de criar um sistema inteligente de diálogo para anotações. O projeto foi desenvolvido pela Build Fast com...
5 meses atrás
01.4K
Diffbot GraphRAG LLM:依赖外部实时知识图谱数据的LLM推理服务

Diffbot GraphRAG LLM: serviço de raciocínio LLM baseado em dados externos de gráficos de conhecimento em tempo real

Introdução abrangente O Diffbot LLM Reasoning Server é um sistema inovador de modelagem de linguagem em larga escala com otimizações e aprimoramentos especiais baseados na arquitetura do modelo LLama. O recurso mais importante do projeto é a integração do Knowledge Graph em tempo real com a geração aprimorada por recuperação...
5 meses atrás
01.3K
LuminaBrush:使用智能绘画工具为图像添加照明打光效果

LuminaBrush: adicionando iluminação a imagens com ferramentas de pintura inteligentes

Introdução geral O LuminaBrush é uma ferramenta inovadora e interativa de edição de imagens para efeitos de iluminação, com tecnologia de inteligência artificial. O projeto usa uma estrutura de dois estágios para processar imagens: o primeiro estágio transforma a imagem de entrada em uma aparência "uniformemente iluminada", enquanto o segundo estágio gera...
5 meses atrás
01.8K
llms.txt Generator:快速抓取网站内容并,生成LLM训练文本数据集

Gerador de llms.txt: capture rapidamente o conteúdo do site e gere conjuntos de dados de texto de treinamento LLM.

Introdução abrangente O llmstxt-generator é uma ferramenta profissional de extração e integração de conteúdo da Web dedicada à preparação de conjuntos de dados textuais de alta qualidade para treinamento e inferência em modelagem de linguagem ampla (LLM). A ferramenta foi desenvolvida pela Mendable AI usando o @firec...
5 meses atrás
01.3K
Raycast-G4F:通过Raycast免费使用GPT-4、Llama-3等多种 AI 模型

Raycast-G4F: Acesso gratuito a GPT-4, Llama-3 e muitos outros modelos de IA via Raycast!

Introdução geral O Raycast-G4F (GPT4Free) é uma poderosa extensão do Raycast que oferece aos usuários acesso gratuito a uma ampla variedade de modelos avançados de IA, incluindo GPT-4 e Llama-3. A extensão não só oferece transmissão de diálogo em tempo real...
5 meses atrás
01.2K
Devin.cursorrules:增强Cursor IDE开发体验,将Cursor/Windsurf打造成类Devin智能编程助手

Devin.cursorrules: aprimoramento da experiência de desenvolvimento do Cursor IDE, tornando o Cursor/Windsurf um assistente de programação inteligente semelhante ao Devin

Introdução geral O Devin.cursorrules é um projeto inovador de código aberto criado para converter o Cursor ou o Windsurf IDE (~US$ 20) em um poderoso assistente de programação com IA, como o Devin. O projeto fornece um conjunto de ...
5 meses atrás
01.4K
Fish Agent:端到端AI语音克隆助手,实时语音对话助理,Fish Speech衍生项目

Fish Agent: assistente de clonagem de voz de IA de ponta a ponta, assistente de diálogo de voz em tempo real, projeto derivado do Fish Speech

Introdução abrangente Fish Speech Derivative Project O Fish Agent é um sistema revolucionário de clonagem de fala de IA de ponta a ponta desenvolvido com base na arquitetura do modelo V0.1 3B. Como um sistema de processamento de clonagem de fala de ponta a ponta, seu recurso mais importante é o uso de...
6 meses atrás
01.1K
小红书AI运营助手:自动生成和发布小红书文章

Assistente de operação de IA do Xiaohongshu: gera e publica automaticamente artigos do Xiaohongshu

Introdução abrangente O Xiaohongshu AI Operation Assistant (xhsaipublisher) é uma ferramenta de automação projetada para publicar artigos na plataforma Xiaohongshu. O projeto combina uma interface gráfica de usuário com scripts de automação para gerar conteúdo usando a tecnologia de modelo grande e fazer login e publicar automaticamente pelo navegador...
6 meses atrás
01.3K
FunClip:智能剪辑视频内容为短片,轻松实现精准视频片段提取/裁剪

FunClip: edição inteligente de conteúdo de vídeo em curtas-metragens, fácil de obter extração/corte precisos de clipes de vídeo

Introdução abrangente O FunClip é uma ferramenta de edição de vídeo automatizada, localizada e de código aberto, desenvolvida pelo TONGYI Speech Lab do Alibaba Dharma Institute. A ferramenta integra o modelo de reconhecimento de fala Paraformer-Large de nível industrial, que pode identificar com precisão a fala no vídeo...
6 meses atrás
01.1K