Whisper Input:利用Groq免费且高速的语音转录文本服务

최신 AI 도구4 개월 전에 게시 됨 Sharenet.ai
701 0
Trae

일반 소개

Whisper Input 是一个开源的语音转译工具,用户可以通过按下 Option 按钮开始录制语音,抬起按钮结束录制。该工具调用 Groq Whisper Large V3 Turbo 模型进行语音转译,能够在 1-2 秒内快速反馈转译结果。Whisper Input 还支持由 SiliconFlow 托管的 FunAudioLLM/SenseVoiceSmall 模型,提供更快的识别速度和更高的准确性。该项目特别适合需要高效语音输入的用户,包括视力障碍者。

Whisper Input:利用Groq免费且高速的语音转录文本服务

 

기능 목록

  • 语音录制与转译:按下 Option 按钮开始录制,抬起按钮结束录制,自动调用模型进行转译。
  • 다국어 지원:支持多种语言的语音转译。
  • 快速反馈:大部分语音输入可以在 1-2 秒内反馈结果。
  • 免费使用:支持 Groq 和 SiliconFlow 提供的免费用量,无需付费。
  • 标点符号支持:自动添加标点符号,提高转译文本的可读性。
  • 无障碍支持:正在开发简易的 macOS 客户端,方便视力障碍用户使用。

 

도움말 사용

설치 프로세스

  1. 前提条件:确保本地有 Python 环境,版本不低于 3.10。
  2. 克隆项目::
   git clone https://github.com/ErlichLiu/Whisper-Input.git
  1. 가상 환경 만들기::
   python -m venv venv
  1. 激活虚拟环境::
    • macOS/Linux: bash
      source venv/bin/activate
    • Windows: bash
      .\venv\Scripts\activate
  2. 종속성 설치::
   pip install pip-tools
pip-compile requirements.in
pip install -r requirements.txt

구성 모델

Groq Whisper Large V3 模型

  1. 注册 Groq 账户::Groq 注册页面
  2. 获取 API KEY::Groq API KEY
  3. 환경 변수 구성::
   cp .env.example .env

将 API KEY 粘贴到 .env 文件中:

   SERVICE_PLATFORM=groq
GROQ_API_KEY=你的API_KEY

SiliconFlow FunAudioLLM/SenseVoiceSmall 模型

  1. 注册 SiliconFlow 账户::SiliconFlow 注册页面
  2. 获取 API KEY::SiliconFlow API KEY
  3. 환경 변수 구성::
   cp .env.example .env

将 API KEY 粘贴到 .env 文件中:

   SERVICE_PLATFORM=siliconflow
SILICONFLOW_API_KEY=你的API_KEY

실행 중인 프로그램

  1. 启动程序::
   python main.py
  1. 사용법:按下 Option 按钮开始录制语音,抬起按钮结束录制,程序会自动进行语音转译并反馈结果。

주의

  • 后台运行:程序需要一直在后台运行,建议在一个不会经常关闭的终端或终端 Tab 中运行。
  • 无障碍支持:未来将上线 macOS 客户端,方便视力障碍用户使用。

一句话描述(简介)

Whisper Input 是一个高效的语音转译工具,支持多语言语音输入,快速准确地将语音转译为文本,适合需要高效语音输入的用户。

© 저작권 정책
AiPPT

관련 문서

댓글 없음

없음
댓글 없음...