AI文本转语音

順番に並べる

Muyan-TTS：パーソナライズされたポッドキャストの音声トレーニングと合成

Synthesis Muyan-TTSは、ポッドキャスティングシナリオ用に設計されたオープンソースのテキスト音声合成（TTS）モデルです。100,000時間以上のポッドキャストオーディオデータで事前にトレーニングされており、ゼロサンプル音声合成をサポートし、高品質の自然な音声を生成します。このモデルはLlama-3.2-3...をベースにしています。

2ヶ月前

0507

Kimi-Audio：オープンソースの音声処理と対話ベースモデル

一般的な紹介 Kimi-Audioは、Moonshot AIによって開発されたオープンソースの音声ベースモデルで、音声の理解、生成、対話に焦点を当てています。音声認識、音声Q&A、音声感情認識など、幅広い音声処理タスクをサポートしています。このモデルは130以上のテストが行われています。

2ヶ月前

0538

Audibit：人気の技術記事をすぐに聴ける音声ポッドキャストにする

一般的な紹介 Audibitはオープンソースプロジェクトで、主な機能は、ハッカーニュース、TechCrunchや他の人気のある技術記事を自動的にオーディオポッドキャストに変換することです。このプロジェクトは...

2ヶ月前

0434

Dia：超リアルな多人数対話生成のための音声合成モデル

一般的な紹介 Diaは、Nari Labsによって開発されたオープンソースのテキスト音声合成（TTS）モデルで、超リアルなダイアログ音声を生成することに重点を置いています。テキストスクリプトを一度の処理でリアルな複数文字のダイアログに変換し、感情やイントネーションの制御をサポートし、さらに非言語表現も生成します。

3ヶ月前

0499

Orpheus-TTS：自然な中国語音声を生成する音声合成ツール

概論 Orpheus-TTSは、人間の自然な音声に近い音声を生成することを目標に、Llama-3bアーキテクチャで開発されたオープンソースの音声合成（TTS）システムです。Canopy AIチームによって開発され、英語、スペイン語、フランス語に対応しています。

3ヶ月前

0576

イレブンラボMCP：スピーチジェネレーションMCPサービス

概論 ElevenLabs MCPはGitHubでホストされているElevenLabsの公式オープンソースプロジェクトです。モデル・コントロール・プロトコル（Model Context Protocol, MCP）に基づいたサービスです。

最新のAIツール # AI音声合成 # MCPサービス

3ヶ月前

0556

Vapi：開発者が低遅延の音声アシスタントを迅速に構築できるようにする

包括的な紹介 Vapiは開発者向けの音声AIプラットフォームです。Vapiは、リアルタイムの会話、電...

最新のAIツール # AIオープンサービス # AI音声合成

3ヶ月前

0554

Conch Speech (MiniMax Audio): 自然な音声を生成するAIツール

包括的な紹介 MiniMax AudioはMiniMax社のAI音声生成ツールで、テキストを類似度の高い自然な音声に素早く変換することを主な特徴としています。Speech-02モデルに基づいており、音声合成の類似度は最大99...

最新のAIツール # AI音声合成 # AIボイスクローニング

1ヶ月前

0687

Text2Voice：シリコンベースのフローAPIに基づく音声合成グラフィカルインターフェース

一般的な紹介 Text2Voiceは、シリコンベースのモビリティAPIに基づいた音声合成機能を提供するオープンソースツールで、クリーンなグラフィカル・ユーザー・インターフェース（GUI）が最大の特徴である。開発者のシェルドン・リーがGitHubで作成したもので、...

3ヶ月前

0548

複数の高度な音声合成サービスを統合したオープンソース運用プロジェクト

概要 Open-VoiceCanvasは、ItusiAIチームによって開発されたオープンソースの音声合成プラットフォームです。50以上の言語をサポートし、テキストを自然な音声に変換したり、音声をアップロードすることでパーソナライズされた音声をクローンすることができます。このプロジェクトはOpe...

3ヶ月前

0680

論文からポッドキャストへ：学術論文を多人数会話のポッドキャストに変換する

一般的な紹介 Paper to Podcastは、学術研究論文を生き生きとした楽しいポッドキャストに変換することに特化したオープンソースのツールです。人工知能技術を使ってPDF形式の論文を3人の登場人物（ホスト、学習者、専門家）の対話に変え、複雑な...

4ヶ月前

0655

MegaTTS3：中国語音声と英語音声を合成する軽量モデル

包括的な紹介 MegaTTS3は、ByteDanceが浙江大学と共同で開発したオープンソースの音声合成ツールで、高品質な中国語と英語の音声を生成することに重点を置いています。MegaTTS3のコアモデルは、わずか0.45Bパラメータで、軽量かつ効率的です。このプロジェクトは ...

4ヶ月前

0872

Podcastle：高品質のポッドキャストを素早く作成するAIツール

概要 Podcastleは、AIベースのオンラインプラットフォームで、ユーザーが高品質なポッドキャストを素早く作成・編集できるよう支援することに特化しています。録音、編集、公開の機能が統合されており、ユーザーは特別な機器や複雑なソフトウェアを必要とせず、すべてブラウザから行うことができる。このプラットフォームが利用するのは...

最新のAIツール # AI音声合成 # AIオーディオ／ビデオ・エディター

4ヶ月前

0706

IndexTTS：中英ミキシング対応音声合成ツール

一般的な紹介 IndexTTSはGitHubでホストされているオープンソースの音声合成(TTS)ツールで、index-tsチームによって開発されています。XTTSとTortoiseの技術をベースに、モジュール設計を改良することで、効率的かつ...

4ヶ月前

0788

csm-mlx: Appleデバイス用csm音声生成モデル

包括的な紹介 csm-mlxはAppleが開発したMLXフレームワークをベースにしており、特にApple Silicon (Apple Silicon) CSM (Conversation Speech Model)音声対話モデル用に最適化されています。このプロジェクトにより、...

4ヶ月前

0694

Autiobooks: epub電子書籍をm4bオーディオブックに変換する

概要 Autiobooksは、.epub形式のeBookを.m4b形式のオーディオブックに素早く変換するためのオープンソースツールです。自然で滑らかな音声を生成するために、Kokoroが提供する高品質の音声合成技術を使用しています。このツールは...

4ヶ月前

0623

PlayHT：超リアルな音声を生成するAIツール

概要 PlayHTは、AI音声生成に特化した効率的なオンラインプラットフォームで、ユーザーがテキストを自然でリアルな音声に素早く変換できるよう支援します。60以上の言語と多様なアクセントをサポートする600以上のAI音声を提供し、ポッドキャスト制作、教育コンテンツ、マーケティングプロモーション...

最新のAIツール # AI音声合成 # AIボイスクローニング

4ヶ月前

0850