AI文本转语音 - 第4页

順番に並べる

ポスト更新目を通すクドス

IMS Toucan: 高速でコントロール可能な多言語（7000以上の言語に対応）音声合成ツール

综合介绍 IMS Toucan 是由德国斯图加特大学自然语言处理研究所（IMS）开发的一个先进的文本转语音（TTS）工具包。该工具包支持超过7000种语言，具有快速、可控且计算资源需求低的特点。IMS...

4ヶ月前

06730

NVIDIA PDF to Podcast：设置引导提示词将PDF转换为播客的AI工具

NVIDIA PDF to Podcast：プロンプトの誘導語を設定してPDFをポッドキャストに変換するAIツール

综合介绍 NVIDIA AI Blueprint: PDF to Podcast 是一个由NVIDIA开发的开源项目，旨在将PDF文档转换为引人入胜的音频内容。该项目利用NVIDIA NIM（NVID...

AIニュース # AI Java オープンソースプロジェクト # AI音声合成

4ヶ月前

06720

MegaTTS3：中国語音声と英語音声を合成する軽量モデル

包括的な紹介 MegaTTS3は、ByteDanceが浙江大学と共同で開発したオープンソースの音声合成ツールで、高品質な中国語と英語の音声を生成することに重点を置いています。MegaTTS3のコアモデルは、わずか0.45Bパラメータで、軽量かつ効率的です。このプロジェクトは ...

2ヶ月前

06590

PlayHT：超リアルな音声を生成するAIツール

概要 PlayHTは、AI音声生成に特化した効率的なオンラインプラットフォームで、ユーザーがテキストを自然でリアルな音声に素早く変換できるよう支援します。60以上の言語と多様なアクセントをサポートする600以上のAI音声を提供し、ポッドキャスト制作、教育コンテンツ、マーケティングプロモーション...

最新のAIツール # AI音声合成 # AIボイスクローニング

3ヶ月前

06510

MLX-Audio: AppleのMLXフレームワークをベースにした音声合成ツール

概要 MLX-Audioは、AppleのMLXフレームワークをベースに開発されたオープンソースツールで、音声合成（TTS）と音声合成（STS）機能に重点を置いています。アップルシリコン（Mシリーズチップなど）のパワーを活用しています...

3ヶ月前

06150

IndexTTS：中英ミキシング対応音声合成ツール

一般的な紹介 IndexTTSはGitHubでホストされているオープンソースの音声合成(TTS)ツールで、index-tsチームによって開発されています。XTTSとTortoiseの技術をベースに、モジュール設計を改良することで、効率的かつ...

2ヶ月前

05700

Azure TTS Importer：音声合成サービスを読み上げソフトウェアに統合する

综合介绍 TTS Importer 是一个开源项目，旨在将 Azure TTS（Text-to-Speech）语音合成服务轻松导入到各种阅读软件中。该工具支持多个流行的阅读软件，包括阅读（legado...

4ヶ月前

05570

キャット＆スター：お子様と一緒に専用の童話を書くための物語リスニングアプリ

総論 "猫と星"（maoyuxing.com）は、子供のために設計されたインタラクティブな物語作成プラットフォームであり、モバイルアプリケーションを通じて、親子が一緒にパーソナライズされたおとぎ話を作成するのに役立ちます。ユーザーは、子供の名前や好みなどの情報を入力することで、ユニークな物語コンテンツを作成することができる。

最新のAIツール # AI教育ツール # AI音声合成

3ヶ月前

05300

Podcastle：高品質のポッドキャストを素早く作成するAIツール

概要 Podcastleは、AIベースのオンラインプラットフォームで、ユーザーが高品質なポッドキャストを素早く作成・編集できるよう支援することに特化しています。録音、編集、公開の機能が統合されており、ユーザーは特別な機器や複雑なソフトウェアを必要とせず、すべてブラウザから行うことができる。このプラットフォームが利用するのは...

最新のAIツール # AI音声合成 # AIオーディオ／ビデオ・エディター

2ヶ月前

05100

csm-mlx: Appleデバイス用csm音声生成モデル

包括的な紹介 csm-mlxはAppleが開発したMLXフレームワークをベースにしており、特にApple Silicon (Apple Silicon) CSM (Conversation Speech Model)音声対話モデル用に最適化されています。このプロジェクトにより、...

3ヶ月前

04970

複数の高度な音声合成サービスを統合したオープンソース運用プロジェクト

概要 Open-VoiceCanvasは、ItusiAIチームによって開発されたオープンソースの音声合成プラットフォームです。50以上の言語をサポートし、テキストを自然な音声に変換したり、音声をアップロードすることでパーソナライズされた音声をクローンすることができます。このプロジェクトはOpe...

2ヶ月前

04700

論文からポッドキャストへ：学術論文を多人数会話のポッドキャストに変換する

一般的な紹介 Paper to Podcastは、学術研究論文を生き生きとした楽しいポッドキャストに変換することに特化したオープンソースのツールです。人工知能技術を使ってPDF形式の論文を3人の登場人物（ホスト、学習者、専門家）の対話に変え、複雑な...

2ヶ月前

04690

Conch Speech (MiniMax Audio): 自然な音声を生成するAIツール

包括的な紹介 MiniMax AudioはMiniMax社のAI音声生成ツールで、テキストを類似度の高い自然な音声に素早く変換することを主な特徴としています。Speech-02モデルに基づいており、音声合成の類似度は最大99...

最新のAIツール # AI音声合成 # AIボイスクローニング

2ヶ月前

04400

Autiobooks: epub電子書籍をm4bオーディオブックに変換する

概要 Autiobooksは、.epub形式のeBookを.m4b形式のオーディオブックに素早く変換するためのオープンソースツールです。自然で滑らかな音声を生成するために、Kokoroが提供する高品質の音声合成技術を使用しています。このツールは...

3ヶ月前

04330

Orpheus-TTS：自然な中国語音声を生成する音声合成ツール

概論 Orpheus-TTSは、人間の自然な音声に近い音声を生成することを目標に、Llama-3bアーキテクチャで開発されたオープンソースの音声合成（TTS）システムです。Canopy AIチームによって開発され、英語、スペイン語、フランス語に対応しています。

2ヶ月前

03590

Text2Voice：シリコンベースのフローAPIに基づく音声合成グラフィカルインターフェース

一般的な紹介 Text2Voiceは、シリコンベースのモビリティAPIに基づいた音声合成機能を提供するオープンソースツールで、クリーンなグラフィカル・ユーザー・インターフェース（GUI）が最大の特徴である。開発者のシェルドン・リーがGitHubで作成したもので、...

2ヶ月前

03570

Vapi：開発者が低遅延の音声アシスタントを迅速に構築できるようにする

包括的な紹介 Vapiは開発者向けの音声AIプラットフォームです。Vapiは、リアルタイムの会話、電...

最新のAIツール # AIオープンサービス # AI音声合成

2ヶ月前

03540

イレブンラボMCP：スピーチジェネレーションMCPサービス

概論 ElevenLabs MCPはGitHubでホストされているElevenLabsの公式オープンソースプロジェクトです。モデル・コントロール・プロトコル（Model Context Protocol, MCP）に基づいたサービスです。

最新のAIツール # AI音声合成 # MCPサービス

2ヶ月前

03360

Dia：超リアルな多人数対話生成のための音声合成モデル

一般的な紹介 Diaは、Nari Labsによって開発されたオープンソースのテキスト音声合成（TTS）モデルで、超リアルなダイアログ音声を生成することに重点を置いています。テキストスクリプトを一度の処理でリアルな複数文字のダイアログに変換し、感情やイントネーションの制御をサポートし、さらに非言語表現も生成します。

2ヶ月前

03020