FireRedASR:多语言高精度语音识别开源模型

FireRedASR: um modelo de código aberto para reconhecimento de fala multilíngue de alta precisão

Introdução geral O FireRedASR é um modelo de reconhecimento de fala desenvolvido e de código aberto pela equipe do Little Red Book FireRed, com foco no fornecimento de soluções de reconhecimento automático de fala (ASR) de alta precisão e com suporte a vários idiomas. O projeto está hospedado no GitHub para desenvolvedores e pesquisadores, e oferece...
3 meses atrás
05890
DeepRant:实时翻译游戏聊天内容的开源客户端

DeepRant: um cliente de código aberto para tradução em tempo real de conteúdo de bate-papo de jogos

Introdução geral O DeepRant é uma ferramenta de tradução de código aberto para jogadores, projetada para resolver o problema das barreiras de idioma em servidores internacionais. Ele permite a tradução instantânea de texto no jogo por meio de teclas de atalho, oferece suporte a vários idiomas para tradução mútua e permite que os jogadores entendam e respondam rapidamente a mensagens de bate-papo sem sair do jogo...
3 meses atrás
05900
Shandu:多轮收集分析信息的AI研究自动化工具

Shandu: uma ferramenta de automação de pesquisa de IA para coleta e análise de informações em várias rodadas

Introdução geral O Shandu é um sistema de pesquisa de código aberto baseado em inteligência artificial hospedado no GitHub e criado pelo desenvolvedor jolovicdev. Ele utiliza as tecnologias LangChain e LangGraph e tem como objetivo fornecer informações automatizadas, abrangentes e...
2 meses atrás
05670
Wan2.1:在消费级 GPU 上生成高质量视频

Wan2.1: Geração de vídeo de alta qualidade em GPUs de consumo

Introdução geral O Wan2.1 é um conjunto de ferramentas de geração de vídeo desenvolvido pela equipe do Wan-Video e de código aberto no GitHub, com foco em ampliar os limites da criação de vídeo por meio de técnicas de inteligência artificial. Ele se baseia em uma arquitetura avançada de transformador de difusão que integra um exclusivo sistema de auto...
3 meses atrás
09260
Yutu:YouTube 命令行管理工具,接入AI全自动运营 YouTube 频道

Yutu: ferramenta de gerenciamento de linha de comando do YouTube, acesso à IA para automatizar totalmente os canais do YouTube

Introdução geral O Yutu é uma poderosa ferramenta de linha de comando de código aberto projetada para usuários do YouTube, hospedada no GitHub e desenvolvida pela equipe eat-pray-ai. Ele opera por meio do terminal para obter os vídeos do YouTube, as listas de reprodução, a frequência...
3 meses atrás
05190
Mahilo:连接不同AI智能体框架实时协作的集成平台

Mahilo: uma plataforma integrada para conectar diferentes estruturas de inteligências de IA para colaborar em tempo real

Introdução geral O Mahilo é uma plataforma de integração de várias inteligências de código aberto, lançada no GitHub pelo desenvolvedor Jayesh Sharma, projetada para ajudar os usuários a conectar inteligências de IA de diferentes estruturas para oferecer suporte à comunicação em tempo real, à interação humano-computador e à colaboração inteligente. O ...
3 meses atrás
05330
OPR:智能修复泛黄、破损老旧照片的AI工具

OPR: a ferramenta de IA que restaura de forma inteligente fotos antigas amareladas e desgastadas

O Bringing Old Photos Back to Life é um projeto de código aberto desenvolvido por uma equipe de pesquisadores da Microsoft que se concentra na restauração de fotos antigas usando a tecnologia de IA. Ele se baseia em uma abordagem de aprendizagem profunda que pode lidar com problemas graves de degradação em fotos, como arranhões...
3 meses atrás
05310
Prompt Optimizer:优化主流AI模型提示词的开源工具

Prompt Optimizer: uma ferramenta de código aberto para otimizar palavras de prompt para modelos de IA convencionais

Introdução geral O Prompt Optimizer é uma ferramenta de código aberto voltada para a otimização de palavras de alerta, desenvolvida por linshenkx no GitHub. Ele ajuda os usuários a otimizar as palavras de alerta dos modelos de IA por meio de algoritmos inteligentes, melhorando assim a qualidade do conteúdo gerado...
3 meses atrás
08170
AI-Infra-Guard:检测AI系统潜在安全风险的开源工具

AI-Infra-Guard: uma ferramenta de código aberto para detectar possíveis riscos de segurança em sistemas de IA

Introdução abrangente O AI-Infra-Guard é uma ferramenta de avaliação de segurança de infraestrutura de IA de código aberto desenvolvida pela equipe de segurança híbrida da Tencent, Zhuqiao Labs, que foi projetada para ajudar os usuários a descobrir e detectar rapidamente possíveis riscos de segurança em sistemas de IA. A ferramenta é compatível com mais de 30 estruturas e componentes de IA para...
3 meses atrás
05530
WhisperChain:实时语音转文字并优化口语化词语

WhisperChain: conversão de voz em texto em tempo real e otimização de palavras faladas

Introdução geral O WhisperChain é um projeto de código aberto baseado em IA hospedado no GitHub e liderado pelo desenvolvedor Chris Choy. Ele é usado principalmente para converter fala em texto e otimizar automaticamente a expressão por meio da tecnologia de IA, removendo redundâncias...
3 meses atrás
05740
Mobius Diffusion:文本提示生成无缝循环视频

Mobius Diffusion: instruções de texto geram um vídeo em loop contínuo

Introdução geral O Mobius Diffusion é uma ferramenta on-line inovadora voltada para a geração de conteúdo de vídeo em loop contínuo a partir de entrada de texto. Ela se baseia em modelos de difusão de vídeo pré-treinados e não requer treinamento do usuário nem dados de anotação para ser iniciada rapidamente. A tecnologia principal do site é a ...
3 meses atrás
05710