OpenAI Edge TTS: API gratuita de conversión de texto a voz mediante Edge TTS, compatible con los formatos de OpenAI.

Últimas herramientas de IAActualizado hace 5 meses Sharenet.ai
1.3K 0
Trae

Introducción general

OpenAI Edge TTS 是一个开源项目,提供与 OpenAI 兼容的本地文本转语音(TTS)API。该项目使用 Microsoft Edge 的在线文本转语音服务,允许用户生成高质量的语音输出。OpenAI Edge TTS 支持多种语音选项和播放速度,能够生成多种音频格式。用户可以通过 Docker 或 Python 进行部署,方便快捷地使用该服务。

相关项目:edge-tts:文本转语音Python模块|免费文本转语音服务 yEdge TTS Worker:使用Cloudflare部署微软语音合成API,兼容OpenAI 格式并封装Web界面

OpenAI Edge TTS:利用 Edge TTS 的免费文本转语音API,兼容 OpenAI 格式

 

Lista de funciones

  • OpenAI 兼容端点:支持与 OpenAI TTS 端点相同的请求结构和行为。
  • 多种语音支持:映射 OpenAI 语音到 Edge TTS 等效语音。
  • 灵活的音频格式:支持 MP3、Opus、AAC、FLAC、WAV、PCM 等多种音频格式。
  • 可调节播放速度:播放速度可在 0.25x 到 4.0x 之间调节。
  • 直接选择 Edge TTS 语音:可使用 OpenAI 语音映射或直接指定任何 Edge TTS 语音。

 

Utilizar la ayuda

Proceso de instalación

使用 Docker 部署(推荐)

  1. almacén de clones::
   git clone https://github.com/travisvn/openai-edge-tts.git
cd openai-edge-tts
  1. 创建环境变量文件: 在项目根目录下创建 .env 文件,包含以下变量:
   API_KEY=your_api_key_here
PORT=5050
DEFAULT_VOICE=en-US-AndrewNeural
DEFAULT_RESPONSE_FORMAT=mp3
DEFAULT_SPEED=1.2
DEFAULT_LANGUAGE=en-US
REQUIRE_API_KEY=True
REMOVE_FILTER=False
EXPAND_API=True
  1. 运行 Docker Compose::
   docker compose up --build

若需在后台运行,使用 -d 参数:

   docker compose up -d

使用 Python 部署

  1. almacén de clones::
   git clone https://github.com/travisvn/openai-edge-tts.git
cd openai-edge-tts
  1. Crear un entorno virtual::
   python3 -m venv venv
source venv/bin/activate
  1. Instalación de dependencias::
   pip install -r requirements.txt
  1. 创建环境变量文件: 在项目根目录下创建 .env 文件,包含上述变量。
  2. 运行服务器::
   python app/main.py

使用说明

  1. 访问 API: 部署完成后,服务器将运行在 http://localhost:5050。可以通过发送 HTTP 请求访问 API 端点 /v1/audio/speech.
  2. 生成语音: 发送 POST 请求到 /v1/audio/speech,请求体包含以下 JSON 数据:
   {
"text": "Hello, world!",
"voice": "en-US-AndrewNeural",
"format": "mp3",
"speed": 1.0
}
  1. 调整播放速度: 修改 speed 参数,范围为 0.25 到 4.0。
  2. 选择语音: 使用 voice 参数指定语音,支持的语音包括 alloy, echo, fable, onyx, nova, shimmer etc.
  3. 音频格式: 使用 format 参数指定音频格式,支持 mp3, opus, aac, flac, wav, pcm etc.

通过以上步骤,用户可以轻松部署和使用 OpenAI Edge TTS 服务,生成高质量的文本转语音输出。

© declaración de copyright
AiPPT

Artículos relacionados

Sin comentarios

ninguno
Sin comentarios...