Fala de IA para texto - Página 2

organizar em ordem

postagem atualização passar por cima elogios

CapsWriter-Offline: ferramenta de entrada de fala e transcrição de legendas para PC

综合介绍 CapsWriter-Offline 是一个专注于PC端的语音输入和字幕转录工具，托管于 GitHub，由开发者 HaujetZhao 打造。它完全离线运行，无需联网即可实现语音转文字和音视...

3 meses atrás

05990

Whisper Input: um serviço de transcrição de voz para texto gratuito e de alta velocidade que usa o Groq

Descrição geral O Whisper Input é uma ferramenta de transcrição de voz de código aberto que permite aos usuários iniciar a gravação de voz pressionando o botão Option e encerrar a gravação levantando o botão. A ferramenta chama o Groq Whisper Large V3 Turbo ...

Ferramentas de IA mais recentes # Projeto de código aberto AI Java # AI Conversão de fala em texto

4 meses atrás

07040

LiberSonora: extração de legendas de audiolivros e tradução multilíngue, transcrição de audiolivros em vários idiomas

Introdução abrangente O LiberSonora, que significa "som livre", é um poderoso conjunto de ferramentas de audiolivro de código aberto habilitado para IA. Ele oferece suporte à extração inteligente de legendas, geração de títulos com IA, tradução em vários idiomas etc., e é capaz de processar off-line em lote com aceleração de GPU.

Ferramentas de IA mais recentes # Projeto de código aberto AI Java Tradução de IA ## AI Conversão de fala em texto

4 meses atrás

06580

AudioNotes: extraia rapidamente o conteúdo de áudio e vídeo e gere notas estruturadas

Introdução abrangente O AudioNotes é um sistema de notas estruturadas de áudio/vídeo desenvolvido com base no FunASR e no Qwen2. Ele pode extrair rapidamente o conteúdo de áudio/vídeo e chamar o grande modelo para gerar notas estruturadas em Markdown, o que é conveniente para...

Ferramentas de IA mais recentes # Projeto de código aberto AI Java # AI Conversão de fala em texto

4 meses atrás

07850

Orate: uma API unificada para integrar a geração de fala, a transcrição de fala e a modelagem de voz do Well-Known

Introdução geral O Orate é um kit de ferramentas de IA voltado para a geração e transcrição de fala. Ele fornece uma API unificada que se integra perfeitamente aos principais provedores de IA, como OpenAI, ElevenLabs e AssemblyAI, para ajudar os usuários a criar...

Ferramentas de IA mais recentes # Projeto de código aberto AI Java # Conversão de texto em fala com IA # AI Conversão de fala em texto

4 meses atrás

09340

PengChengStarling：对比Whisper-Large v3更小、更快的多语言语音转文字工具

PengChengStarling: ferramenta de conversão de fala em texto multilíngue menor e mais rápida que o Whisper-Large v3

Introdução abrangente O PengChengStarling (PengCheng Labs) é uma ferramenta de reconhecimento automático de fala (ASR) multilíngue capaz de converter a fala em diferentes idiomas em texto correspondente. Esse kit de ferramentas foi desenvolvido com base no projeto icefall e fornece um processo completo de reconhecimento de fala...

Ferramentas de IA mais recentes # Projeto de código aberto AI Java # AI Conversão de fala em texto

4 meses atrás

08000

Insanely Fast Whisper: projeto de código aberto de transcrição rápida e eficiente de fala para texto

综合介绍 insanely-fast-whisper是一个结合了OpenAI的Whisper模型和各种优化技术（如Transformers, Optimum, Flash Attention）的音频转...

Ferramentas de IA mais recentes # Projeto de código aberto AI Java # AI Conversão de fala em texto

4 meses atrás

01.4K0

RealtimeSTT：实时语音转文字工具，基于Whisper实现低延迟流式语音识别

RealtimeSTT: ferramenta de conversão de fala em texto em tempo real para reconhecimento de fala em streaming de baixa latência com base no Whisper

Introdução geral O RealtimeSTT é uma biblioteca de conversão de fala em texto eficiente e de baixa latência em tempo real, com detecção avançada de atividade de fala e ativação de palavras de alerta. Ela foi desenvolvida por Kolja Beigel para dar suporte a aplicativos que exigem conversão de fala em texto rápida e precisa...

Notícias sobre IA # Projeto de código aberto AI Java # AI Conversão de fala em texto

5 meses atrás

01.2K0

ALog: aplicativo portátil de diário de voz com IA e suporte de fala para texto.

综合介绍 ALog 是一个基于人工智能的语音日记应用，旨在帮助用户通过语音记录日常生活。该项目由 duxins 开发，并在 GitHub 上开源。用户可以通过语音输入记录日记，应用会自动将语音转换为文...

Ferramentas de IA mais recentes # Projeto de código aberto AI Java # AI Conversão de fala em texto

5 meses atrás

01.4K0

Sherpa-ONNX: reconhecimento e síntese de fala off-line com o ONNXRuntime

Introdução geral O sherpa-onnx é um projeto de código aberto desenvolvido pela equipe do Next-gen Kaldi para fornecer soluções eficientes de reconhecimento e síntese de fala off-line. Ele é compatível com várias plataformas, incluindo Android, iOS, Raspber...

Ferramentas de IA mais recentes # Projeto de código aberto AI Java # Conversão de texto em fala com IA # AI Conversão de fala em texto

5 meses atrás

01.5K0

Acoust: plataformas de serviços de geração de fala com IA on-line e de conversão de texto em fala (TTS)

Introdução geral O Acoust é uma plataforma de serviços de geração de fala com IA on-line e de conversão de texto em fala (TTS) que usa a mais recente tecnologia de IA para gerar uma fala realista. A plataforma também oferece ferramentas avançadas de edição de vídeo que permitem aos usuários concluir a produção de vídeo sem a necessidade de vários softwares.

Ferramentas de IA mais recentes # Conversão de texto em fala com IA # AI Conversão de fala em texto

5 meses atrás

09170

Notta: ferramenta de transcrição de áudio e gravação de reuniões com IA para transcrever automaticamente reuniões, entrevistas ou gravações

Descrição geral O Notta é uma poderosa ferramenta de transcrição de áudio e gravação de reuniões com IA projetada para ajudar os usuários a converter automaticamente reuniões, entrevistas ou gravações de áudio em texto pesquisável. Com o Notta, os usuários podem facilmente transcrever, editar, resumir e colaborar para aumentar a produtividade.

Ferramentas de IA mais recentes # Ferramenta de resumo de texto e áudio/vídeo com IA # AI Conversão de fala em texto

5 meses atrás

01.4K0

CrisperWhisper: Ferramenta de transcrição exata e fiel da fala

综合介绍 CrisperWhisper 是一个基于 OpenAI Whisper 的高级语音识别工具，专注于快速、精确和逐字的语音转录。它能够提供精确的单词级时间戳，甚至在语音填充和停顿的情况下也能准...

Ferramentas de IA mais recentes # Projeto de código aberto AI Java # AI Conversão de fala em texto

5 meses atrás

01.5K0

AI no jimaku gumi: geração e tradução automáticas de legendas multilíngues para vídeos com a ajuda da IA

Introdução geral O AI no jimaku gumi (AI no subtitle group) é uma poderosa ferramenta de processamento de legendas de vídeo de linha de comando, cujo foco é permitir funções automatizadas de extração, transcrição e tradução de legendas de vídeo. A ferramenta integra tecnologias avançadas de IA, incluindo a fala Whisper...

Ferramentas de IA mais recentes # Projeto de código aberto AI Java Tradução de IA ## AI Conversão de fala em texto

5 meses atrás

01K0

FunClip: edição inteligente de conteúdo de vídeo em curtas-metragens, fácil de obter extração/corte precisos de clipes de vídeo

Introdução abrangente O FunClip é uma ferramenta de edição de vídeo automatizada, localizada e de código aberto, desenvolvida pelo TONGYI Speech Lab do Alibaba Dharma Institute. A ferramenta integra o modelo de reconhecimento de fala Paraformer-Large de nível industrial, que pode identificar com precisão a fala no vídeo...

Ferramentas de IA mais recentes # Projeto de código aberto AI Java # AI Conversão de fala em texto Editor de áudio/vídeo # AI

5 meses atrás

01K0

BetterWhisperX: reconhecimento automático de fala separado do alto-falante, fornecendo registros de tempo altamente precisos no nível da palavra

Introdução geral O BetterWhisperX é uma versão otimizada do projeto WhisperX, com foco no fornecimento de serviços de reconhecimento automático de fala (ASR) eficientes e precisos. Como um desdobramento aprimorado do WhisperX, o projeto foi desenvolvido por Federico ...

Ferramentas de IA mais recentes # Projeto de código aberto AI Java # AI Conversão de fala em texto

5 meses atrás

01.3K0

Freed: assistente de transcrição médica com IA que transcreve com precisão as conversas entre médico e paciente e reduz a papelada de documentação da consulta

Descrição geral O Freed é um assistente de transcrição médica com IA projetado para profissionais de saúde. Ele ajuda os médicos e outros profissionais de saúde a automatizar o registro das visitas dos pacientes, reduzir a burocracia e melhorar a eficiência do trabalho por meio da tecnologia avançada de IA...

Ferramentas de IA mais recentes # AI Conversão de fala em texto

5 meses atrás

01.2K0

Voicenotes: anotações de voz com IA, gravação e transcrição de voz, gerenciamento inteligente do conteúdo da reunião

Introdução geral O Voicenotes é um aplicativo inteligente de anotações de voz projetado para ajudar os usuários a gravar e gerenciar facilmente anotações de voz e reuniões. O aplicativo suporta transcrição de voz em mais de 100 idiomas. Os usuários simplesmente falam seus pensamentos e o Voicenotes os transcreve automaticamente em texto...

Ferramentas de IA mais recentes Notas de IA do ## AI Conversão de fala em texto

5 meses atrás

01.2K0