Muyan-TTS:个性化播客语音训练与合成

Muyan-TTS:パーソナライズされたポッドキャストの音声トレーニングと合成

Synthesis Muyan-TTSは、ポッドキャスティングシナリオ用に設計されたオープンソースのテキスト音声合成(TTS)モデルです。100,000時間以上のポッドキャストオーディオデータで事前にトレーニングされており、ゼロサンプル音声合成をサポートし、高品質の自然な音声を生成します。このモデルはLlama-3.2-3...をベースにしています。
2ヶ月前
0507
Kimi-Audio:开源音频处理与对话基础模型

Kimi-Audio:オープンソースの音声処理と対話ベースモデル

一般的な紹介 Kimi-Audioは、Moonshot AIによって開発されたオープンソースの音声ベースモデルで、音声の理解、生成、対話に焦点を当てています。音声認識、音声Q&A、音声感情認識など、幅広い音声処理タスクをサポートしています。このモデルは130以上のテストが行われています。
2ヶ月前
0538
Dia:生成超现实多人对话的文本转语音模型

Dia:超リアルな多人数対話生成のための音声合成モデル

一般的な紹介 Diaは、Nari Labsによって開発されたオープンソースのテキスト音声合成(TTS)モデルで、超リアルなダイアログ音声を生成することに重点を置いています。テキストスクリプトを一度の処理でリアルな複数文字のダイアログに変換し、感情やイントネーションの制御をサポートし、さらに非言語表現も生成します。
3ヶ月前
0499
Text2Voice:基于硅基流动API的文本转语音图形界面

Text2Voice:シリコンベースのフローAPIに基づく音声合成グラフィカルインターフェース

一般的な紹介 Text2Voiceは、シリコンベースのモビリティAPIに基づいた音声合成機能を提供するオープンソースツールで、クリーンなグラフィカル・ユーザー・インターフェース(GUI)が最大の特徴である。開発者のシェルドン・リーがGitHubで作成したもので、...
3ヶ月前
0548
集成多种先进语音合成服务的开源运营项目

複数の高度な音声合成サービスを統合したオープンソース運用プロジェクト

概要 Open-VoiceCanvasは、ItusiAIチームによって開発されたオープンソースの音声合成プラットフォームです。50以上の言語をサポートし、テキストを自然な音声に変換したり、音声をアップロードすることでパーソナライズされた音声をクローンすることができます。このプロジェクトはOpe...
3ヶ月前
0680
Paper to Podcast:把学术论文转换为多人对话播客

論文からポッドキャストへ:学術論文を多人数会話のポッドキャストに変換する

一般的な紹介 Paper to Podcastは、学術研究論文を生き生きとした楽しいポッドキャストに変換することに特化したオープンソースのツールです。人工知能技術を使ってPDF形式の論文を3人の登場人物(ホスト、学習者、専門家)の対話に変え、複雑な...
4ヶ月前
0655
MegaTTS3:合成中英文语音的轻量模型

MegaTTS3:中国語音声と英語音声を合成する軽量モデル

包括的な紹介 MegaTTS3は、ByteDanceが浙江大学と共同で開発したオープンソースの音声合成ツールで、高品質な中国語と英語の音声を生成することに重点を置いています。MegaTTS3のコアモデルは、わずか0.45Bパラメータで、軽量かつ効率的です。このプロジェクトは ...
4ヶ月前
0872
Podcastle:快速创建高质量播客的AI工具

Podcastle:高品質のポッドキャストを素早く作成するAIツール

概要 Podcastleは、AIベースのオンラインプラットフォームで、ユーザーが高品質なポッドキャストを素早く作成・編集できるよう支援することに特化しています。録音、編集、公開の機能が統合されており、ユーザーは特別な機器や複雑なソフトウェアを必要とせず、すべてブラウザから行うことができる。このプラットフォームが利用するのは...
4ヶ月前
0706
PlayHT:生成超真实语音的AI工具

PlayHT:超リアルな音声を生成するAIツール

概要 PlayHTは、AI音声生成に特化した効率的なオンラインプラットフォームで、ユーザーがテキストを自然でリアルな音声に素早く変換できるよう支援します。60以上の言語と多様なアクセントをサポートする600以上のAI音声を提供し、ポッドキャスト制作、教育コンテンツ、マーケティングプロモーション...
4ヶ月前
0850