Whisper Input: un servicio gratuito y rápido de transcripción de voz a texto mediante Groq

Últimas herramientas de IAPublicado hace 5 meses Sharenet.ai

932 0

Introducción general

Whisper Input 是一个开源的语音转译工具，用户可以通过按下 Option 按钮开始录制语音，抬起按钮结束录制。该工具调用 Groq Whisper Large V3 Turbo 模型进行语音转译，能够在 1-2 秒内快速反馈转译结果。Whisper Input 还支持由 SiliconFlow 托管的 FunAudioLLM/SenseVoiceSmall 模型，提供更快的识别速度和更高的准确性。该项目特别适合需要高效语音输入的用户，包括视力障碍者。

Lista de funciones

语音录制与转译：按下 Option 按钮开始录制，抬起按钮结束录制，自动调用模型进行转译。
Soporte multilingüe：支持多种语言的语音转译。
快速反馈：大部分语音输入可以在 1-2 秒内反馈结果。
免费使用：支持 Groq 和 SiliconFlow 提供的免费用量，无需付费。
标点符号支持：自动添加标点符号，提高转译文本的可读性。
无障碍支持：正在开发简易的 macOS 客户端，方便视力障碍用户使用。

Utilizar la ayuda

Proceso de instalación

前提条件：确保本地有 Python 环境，版本不低于 3.10。
proyecto de clonación::

   git clone https://github.com/ErlichLiu/Whisper-Input.git

Creación de un entorno virtual::

   python -m venv venv

激活虚拟环境::
- macOS/Linux: bash source venv/bin/activate
- Ventanas. bash .\venv\Scripts\activate
Instalación de dependencias::

   pip install pip-tools
pip-compile requirements.in
pip install -r requirements.txt

modelo de configuración

Groq Whisper Large V3 模型

注册 Groq 账户::Groq 注册页面
获取 API KEY::Groq API KEY
Configuración de variables de entorno::

   cp .env.example .env

将 API KEY 粘贴到 .env Documentación:

   SERVICE_PLATFORM=groq
GROQ_API_KEY=你的API_KEY

SiliconFlow FunAudioLLM/SenseVoiceSmall 模型

注册 SiliconFlow 账户::SiliconFlow 注册页面
获取 API KEY::SiliconFlow API KEY
Configuración de variables de entorno::

   cp .env.example .env

将 API KEY 粘贴到 .env Documentación:

   SERVICE_PLATFORM=siliconflow
SILICONFLOW_API_KEY=你的API_KEY

programa de carrera

procedimiento de activación::

   python main.py

Utilización：按下 Option 按钮开始录制语音，抬起按钮结束录制，程序会自动进行语音转译并反馈结果。

advertencia

后台运行：程序需要一直在后台运行，建议在一个不会经常关闭的终端或终端 Tab 中运行。
无障碍支持：未来将上线 macOS 客户端，方便视力障碍用户使用。

一句话描述（简介）

Whisper Input 是一个高效的语音转译工具，支持多语言语音输入，快速准确地将语音转译为文本，适合需要高效语音输入的用户。

El artículo está protegido por derechos de autor y no debe reproducirse sin autorización.

Decagon：企业级客户服务智能体解决方案

Últimas herramientas de IA # Robot AI de atención al cliente

hace 6 meses

01.4K

Gemini-OpenAI：反代Gemini地址绕过区域限制并转换为OpenAI兼容API

Últimas herramientas de IA # AI Java Proyecto de código abierto

hace 6 meses

01.5K

Narrify：将书籍转化为音频摘要，随时随地聆听精华

Últimas herramientas de IA # Herramienta AI de resumen de texto y audio/vídeo

hace 6 meses

01.1K

Weebo: un chatbot de voz en tiempo real que ofrece una experiencia de diálogo en lenguaje natural

Últimas herramientas de IA # AI Java Proyecto de código abierto # Producto interactivo multimodal en tiempo real

hace 6 meses

01.3K

Sin comentarios

Sin comentarios...

Whisper Input: un servicio gratuito y rápido de transcripción de voz a texto mediante Groq

Introducción general

Lista de funciones

Utilizar la ayuda

Proceso de instalación

modelo de configuración

Groq Whisper Large V3 模型

SiliconFlow FunAudioLLM/SenseVoiceSmall 模型

programa de carrera

advertencia

一句话描述（简介）

Azure TTS Importer: integración de servicios de síntesis de voz en el software de lectura

Quadratic: formularios de análisis de datos en línea que integran el diálogo con la IA y la ejecución de código

Artículos relacionados

Decagon：企业级客户服务智能体解决方案

Gemini-OpenAI：反代Gemini地址绕过区域限制并转换为OpenAI兼容API

Narrify：将书籍转化为音频摘要，随时随地聆听精华

Weebo: un chatbot de voz en tiempo real que ofrece una experiencia de diálogo en lenguaje natural

Sin comentarios

Últimos artículos

Whisper Input: un servicio gratuito y rápido de transcripción de voz a texto mediante Groq

Introducción general

Lista de funciones

Utilizar la ayuda

Proceso de instalación

modelo de configuración

Groq Whisper Large V3 模型

SiliconFlow FunAudioLLM/SenseVoiceSmall 模型

programa de carrera

advertencia

一句话描述（简介）

Azure TTS Importer: integración de servicios de síntesis de voz en el software de lectura

Quadratic: formularios de análisis de datos en línea que integran el diálogo con la IA y la ejecución de código

Artículos relacionados

Decagon：企业级客户服务智能体解决方案

Gemini-OpenAI：反代Gemini地址绕过区域限制并转换为OpenAI兼容API

Narrify：将书籍转化为音频摘要，随时随地聆听精华

Weebo: un chatbot de voz en tiempo real que ofrece una experiencia de diálogo en lenguaje natural

Sin comentarios

Herramientas de IA seleccionadas

Últimos artículos