OpenAI Edge TTS:利用 Edge TTS 的免费文本转语音API,兼容 OpenAI 格式

최신 AI 도구5개월 전 업데이트 Sharenet.ai
1.3K 0
Trae

일반 소개

OpenAI Edge TTS 是一个开源项目,提供与 OpenAI 兼容的本地文本转语音(TTS)API。该项目使用 Microsoft Edge 的在线文本转语音服务,允许用户生成高质量的语音输出。OpenAI Edge TTS 支持多种语音选项和播放速度,能够生成多种音频格式。用户可以通过 Docker 或 Python 进行部署,方便快捷地使用该服务。

相关项目:edge-tts:文本转语音Python模块|免费文本转语音服务 및Edge TTS Worker:使用Cloudflare部署微软语音合成API,兼容OpenAI 格式并封装Web界面

OpenAI Edge TTS:利用 Edge TTS 的免费文本转语音API,兼容 OpenAI 格式

 

기능 목록

  • OpenAI 兼容端点:支持与 OpenAI TTS 端点相同的请求结构和行为。
  • 多种语音支持:映射 OpenAI 语音到 Edge TTS 等效语音。
  • 灵活的音频格式:支持 MP3、Opus、AAC、FLAC、WAV、PCM 等多种音频格式。
  • 可调节播放速度:播放速度可在 0.25x 到 4.0x 之间调节。
  • 直接选择 Edge TTS 语音:可使用 OpenAI 语音映射或直接指定任何 Edge TTS 语音。

 

도움말 사용

설치 프로세스

使用 Docker 部署(推荐)

  1. 클론 창고::
   git clone https://github.com/travisvn/openai-edge-tts.git
cd openai-edge-tts
  1. 创建环境变量文件: 在项目根目录下创建 .env 文件,包含以下变量:
   API_KEY=your_api_key_here
PORT=5050
DEFAULT_VOICE=en-US-AndrewNeural
DEFAULT_RESPONSE_FORMAT=mp3
DEFAULT_SPEED=1.2
DEFAULT_LANGUAGE=en-US
REQUIRE_API_KEY=True
REMOVE_FILTER=False
EXPAND_API=True
  1. 运行 Docker Compose::
   docker compose up --build

若需在后台运行,使用 -d 参数:

   docker compose up -d

使用 Python 部署

  1. 클론 창고::
   git clone https://github.com/travisvn/openai-edge-tts.git
cd openai-edge-tts
  1. 设置虚拟环境::
   python3 -m venv venv
source venv/bin/activate
  1. 종속성 설치::
   pip install -r requirements.txt
  1. 创建环境变量文件: 在项目根目录下创建 .env 文件,包含上述变量。
  2. 运行服务器::
   python app/main.py

사용 지침

  1. 访问 API: 部署完成后,服务器将运行在 http://localhost:5050。可以通过发送 HTTP 请求访问 API 端点 /v1/audio/speech.
  2. 生成语音: 发送 POST 请求到 /v1/audio/speech,请求体包含以下 JSON 数据:
   {
"text": "Hello, world!",
"voice": "en-US-AndrewNeural",
"format": "mp3",
"speed": 1.0
}
  1. 调整播放速度: 修改 speed 参数,范围为 0.25 到 4.0。
  2. 选择语音: 使用 voice 参数指定语音,支持的语音包括 alloy, echo, fable, onyx, nova, shimmer
  3. 音频格式: 使用 format 参数指定音频格式,支持 mp3, opus, aac, flac, wav, pcm

通过以上步骤,用户可以轻松部署和使用 OpenAI Edge TTS 服务,生成高质量的文本转语音输出。

© 저작권 정책
AiPPT

관련 문서

댓글 없음

없음
댓글 없음...