LiberSonora:有声书字幕提取与多语言翻译,有声小说转录为多语言

LiberSonora: extração de legendas de audiolivros e tradução multilíngue, transcrição de audiolivros em vários idiomas

Introdução abrangente O LiberSonora, que significa "som livre", é um poderoso conjunto de ferramentas de audiolivro de código aberto habilitado para IA. Ele oferece suporte à extração inteligente de legendas, geração de títulos com IA, tradução em vários idiomas etc., e é capaz de processar off-line em lote com aceleração de GPU.
4 meses atrás
06500
Orate:集成知名语音生成、语音转录与变声模型的统一API

Orate: uma API unificada para integrar a geração de fala, a transcrição de fala e a modelagem de voz do Well-Known

Introdução geral O Orate é um kit de ferramentas de IA voltado para a geração e transcrição de fala. Ele fornece uma API unificada que se integra perfeitamente aos principais provedores de IA, como OpenAI, ElevenLabs e AssemblyAI, para ajudar os usuários a criar...
4 meses atrás
09280
PengChengStarling:对比Whisper-Large v3更小、更快的多语言语音转文字工具

PengChengStarling: ferramenta de conversão de fala em texto multilíngue menor e mais rápida que o Whisper-Large v3

Introdução abrangente O PengChengStarling (PengCheng Labs) é uma ferramenta de reconhecimento automático de fala (ASR) multilíngue capaz de converter a fala em diferentes idiomas em texto correspondente. Esse kit de ferramentas foi desenvolvido com base no projeto icefall e fornece um processo completo de reconhecimento de fala...
4 meses atrás
07990
RealtimeSTT:实时语音转文字工具,基于Whisper实现低延迟流式语音识别

RealtimeSTT: ferramenta de conversão de fala em texto em tempo real para reconhecimento de fala em streaming de baixa latência com base no Whisper

Introdução geral O RealtimeSTT é uma biblioteca de conversão de fala em texto eficiente e de baixa latência em tempo real, com detecção avançada de atividade de fala e ativação de palavras de alerta. Ela foi desenvolvida por Kolja Beigel para dar suporte a aplicativos que exigem conversão de fala em texto rápida e precisa...
4 meses atrás
01.2K0
Acoust:在线AI语音生成和文本转语音(TTS)服务平台

Acoust: plataformas de serviços de geração de fala com IA on-line e de conversão de texto em fala (TTS)

Introdução geral O Acoust é uma plataforma de serviços de geração de fala com IA on-line e de conversão de texto em fala (TTS) que usa a mais recente tecnologia de IA para gerar uma fala realista. A plataforma também oferece ferramentas avançadas de edição de vídeo que permitem aos usuários concluir a produção de vídeo sem a necessidade de vários softwares.
5 meses atrás
09090
Notta:AI会议记录与音频转录工具,自动转录会议、采访或录音

Notta: ferramenta de transcrição de áudio e gravação de reuniões com IA para transcrever automaticamente reuniões, entrevistas ou gravações

Descrição geral O Notta é uma poderosa ferramenta de transcrição de áudio e gravação de reuniões com IA projetada para ajudar os usuários a converter automaticamente reuniões, entrevistas ou gravações de áudio em texto pesquisável. Com o Notta, os usuários podem facilmente transcrever, editar, resumir e colaborar para aumentar a produtividade.
5 meses atrás
01.4K0
AI no jimaku gumi:借助AI实现视频多语言字幕自动生成和翻译

AI no jimaku gumi: geração e tradução automáticas de legendas multilíngues para vídeos com a ajuda da IA

Introdução geral O AI no jimaku gumi (AI no subtitle group) é uma poderosa ferramenta de processamento de legendas de vídeo de linha de comando, cujo foco é permitir funções automatizadas de extração, transcrição e tradução de legendas de vídeo. A ferramenta integra tecnologias avançadas de IA, incluindo a fala Whisper...
5 meses atrás
01K0
FunClip:智能剪辑视频内容为短片,轻松实现精准视频片段提取/裁剪

FunClip: edição inteligente de conteúdo de vídeo em curtas-metragens, fácil de obter extração/corte precisos de clipes de vídeo

Introdução abrangente O FunClip é uma ferramenta de edição de vídeo automatizada, localizada e de código aberto, desenvolvida pelo TONGYI Speech Lab do Alibaba Dharma Institute. A ferramenta integra o modelo de reconhecimento de fala Paraformer-Large de nível industrial, que pode identificar com precisão a fala no vídeo...
5 meses atrás
01K0
BetterWhisperX:自动语音识别与说话人分离,提供高精度单词级时间戳

BetterWhisperX: reconhecimento automático de fala separado do alto-falante, fornecendo registros de tempo altamente precisos no nível da palavra

Introdução geral O BetterWhisperX é uma versão otimizada do projeto WhisperX, com foco no fornecimento de serviços de reconhecimento automático de fala (ASR) eficientes e precisos. Como um desdobramento aprimorado do WhisperX, o projeto foi desenvolvido por Federico ...
5 meses atrás
01.3K0
Freed:AI医疗抄写助手,准确转录医生和患者对话,减少就诊记录文书工作

Freed: assistente de transcrição médica com IA que transcreve com precisão as conversas entre médico e paciente e reduz a papelada de documentação da consulta

Descrição geral O Freed é um assistente de transcrição médica com IA projetado para profissionais de saúde. Ele ajuda os médicos e outros profissionais de saúde a automatizar o registro das visitas dos pacientes, reduzir a burocracia e melhorar a eficiência do trabalho por meio da tecnologia avançada de IA...
5 meses atrás
01.2K0
Voicenotes:AI语音笔记,记录与转录语音,智能管理会议内容

Voicenotes: anotações de voz com IA, gravação e transcrição de voz, gerenciamento inteligente do conteúdo da reunião

Introdução geral O Voicenotes é um aplicativo inteligente de anotações de voz projetado para ajudar os usuários a gravar e gerenciar facilmente anotações de voz e reuniões. O aplicativo suporta transcrição de voz em mais de 100 idiomas. Os usuários simplesmente falam seus pensamentos e o Voicenotes os transcreve automaticamente em texto...
5 meses atrás
01.2K0
Voice-Pro:开源多功能视频翻译工具,语音转录并翻译为多语言,Windows一键安装

Voice-Pro: ferramenta de tradução de vídeo multifuncional de código aberto, transcrição e tradução de voz em vários idiomas, instalação com um clique no Windows

Introdução geral O Voice-Pro é uma ferramenta versátil baseada na Gradio WebUI que oferece suporte a conversão de fala em texto, conversão de texto em fala, tradução em tempo real, downloads de vídeos do YouTube e separação de voz humana. Ele integra o Whisper, o Faster-Wh...
6 meses atrás
01.2K0
Zamzar:多功能在线文件格式转换工具,视频转换|音频转换|图片转换|文档转换

Zamzar: ferramenta on-line multifuncional de conversão de formatos de arquivos, conversão de vídeo, conversão de áudio, conversão de imagens, conversão de documentos

Introdução geral O Zamzar é uma poderosa ferramenta de conversão de arquivos on-line que suporta mais de 1.200 formatos de arquivos. Quer se trate de documentos, imagens, vídeos, áudios ou livros eletrônicos, o Zamzar pode fazer isso de forma rápida e eficiente. Os usuários não precisam fazer download de nenhum software...
7 meses atrás
01.4K0
AI Hear:本地离线运行的实时语音转录与翻译软件

AI Hear: software de transcrição e tradução de fala em tempo real que funciona nativamente off-line

Descrição geral Se estiver usando um MacBook, experimente o AI Hear: você pode gravar áudio, converter fala local em tempo real em texto, traduzir e, eventualmente, exportar legendas. Você pode usá-lo para ajudá-lo a ouvir reuniões entre países e audiolivros em inglês. O AI Hear é um software executado localmente que fornece fala em tempo real com um clique...
7 meses atrás
01.2K0
SoniTranslate:开源视频翻译配音解决方案,多人配音、调整语速与模仿原声

SoniTranslate: solução de dublagem de tradução de vídeo de código aberto, dublagem múltipla, ajuste de velocidade e imitação do som original

Descrição geral O SoniTranslate é uma ferramenta de dublagem multilíngue de vídeo avançada e fácil de usar, projetada para fornecer uma solução de tradução de vídeo e áudio sincronizado. Ele usa tecnologias avançadas de reconhecimento de fala e tradução automática para traduzir o conteúdo do vídeo em vários idiomas e manter o áudio sincronizado. O ...
7 meses atrás
02.4K0
FunASR:开源语音识别工具包,说话人分离/ 多人对话语音识别

FunASR: kit de ferramentas de reconhecimento de fala de código aberto, separação de locutor / reconhecimento de fala de diálogo com várias pessoas

Introdução abrangente O FunASR é um kit de ferramentas de reconhecimento de fala de código aberto desenvolvido pelo Alibaba Dharma Institute, com o objetivo de unir pesquisa acadêmica e aplicações industriais. Ele suporta uma ampla gama de recursos de reconhecimento de fala, incluindo reconhecimento de fala (ASR), detecção de ponto final de voz (VAD), recuperação de pontuação, modelagem de linguagem, fala...
8 meses atrás
01.7K0