OpenAI Edge TTS：利用 Edge TTS 的免费文本转语音API，兼容 OpenAI 格式

1.6K 0

일반 소개

OpenAI Edge TTS 是一个开源项目，提供与 OpenAI 兼容的本地文本转语音（TTS）API。该项目使用 Microsoft Edge 的在线文本转语音服务，允许用户生成高质量的语音输出。OpenAI Edge TTS 支持多种语音选项和播放速度，能够生成多种音频格式。用户可以通过 Docker 或 Python 进行部署，方便快捷地使用该服务。

OpenAI Edge TTS：利用 Edge TTS 的免费文本转语音API，兼容 OpenAI 格式

기능 목록

OpenAI 兼容端点：支持与 OpenAI TTS 端点相同的请求结构和行为。
多种语音支持：映射 OpenAI 语音到 Edge TTS 等效语音。
灵活的音频格式：支持 MP3、Opus、AAC、FLAC、WAV、PCM 等多种音频格式。
可调节播放速度：播放速度可在 0.25x 到 4.0x 之间调节。
直接选择 Edge TTS 语音：可使用 OpenAI 语音映射或直接指定任何 Edge TTS 语音。

도움말 사용

설치 프로세스

使用 Docker 部署（推荐）

클론 창고::

   git clone https://github.com/travisvn/openai-edge-tts.git
cd openai-edge-tts

创建环境变量文件：在项目根目录下创建 .env 文件，包含以下变量：

   API_KEY=your_api_key_here
PORT=5050
DEFAULT_VOICE=en-US-AndrewNeural
DEFAULT_RESPONSE_FORMAT=mp3
DEFAULT_SPEED=1.2
DEFAULT_LANGUAGE=en-US
REQUIRE_API_KEY=True
REMOVE_FILTER=False
EXPAND_API=True

运行 Docker Compose::

   docker compose up --build

若需在后台运行，使用 -d 매개변수:

   docker compose up -d

使用 Python 部署

클론 창고::

   git clone https://github.com/travisvn/openai-edge-tts.git
cd openai-edge-tts

设置虚拟环境::

   python3 -m venv venv
source venv/bin/activate

종속성 설치::

   pip install -r requirements.txt

创建环境变量文件：在项目根目录下创建 .env 文件，包含上述变量。
운영 서버::

   python app/main.py

사용 지침

访问 API：部署完成后，服务器将运行在 http://localhost:5050。可以通过发送 HTTP 请求访问 API 端点 /v1/audio/speech.
生成语音：发送 POST 请求到 /v1/audio/speech，请求体包含以下 JSON 数据：

   {
"text": "Hello, world!",
"voice": "en-US-AndrewNeural",
"format": "mp3",
"speed": 1.0
}

调整播放速度：修改 speed 参数，范围为 0.25 到 4.0。
음성 선택：使用 voice 参数指定语音，支持的语音包括 alloy, echo, fable, onyx, nova, shimmer 등
音频格式：使用 format 参数指定音频格式，支持 mp3, opus, aac, flac, wav, pcm 등