AI语音克隆 | Sharenet

順番に並べる

ポスト更新目を通すクドス

Conch Speech (MiniMax Audio): 自然な音声を生成するAIツール

包括的な紹介 MiniMax AudioはMiniMax社のAI音声生成ツールで、テキストを類似度の高い自然な音声に素早く変換することを主な特徴としています。Speech-02モデルに基づいており、音声合成の類似度は最大99...

最新のAIツール # AI音声合成 # AIボイスクローニング

1ヶ月前

0689

MegaTTS3：中国語音声と英語音声を合成する軽量モデル

包括的な紹介 MegaTTS3は、ByteDanceが浙江大学と共同で開発したオープンソースの音声合成ツールで、高品質な中国語と英語の音声を生成することに重点を置いています。MegaTTS3のコアモデルは、わずか0.45Bパラメータで、軽量かつ効率的です。このプロジェクトは ...

4ヶ月前

0874

Seed-VC：少ないサンプル数で音声と歌のリアルタイム変換に対応

概要 Seed-VCはPlachtaaによって開発されたGitHub上のオープンソースプロジェクトです。Seed-VCは、1秒から30秒のリファレンスオーディオを使用することができます。このプロジェクトは、リアルタイムの音声変換、ディレイ変換、音声合成をサポートしています。

4ヶ月前

0705

CSMボイスクローニング：CSM-1Bによる高速ボイスクローニング

概要 CSM Voice Cloningは、Isaiah Bjorkによって開発され、GitHubでホストされているオープンソースプロジェクトです。このプロジェクトはSesame CSM-1Bモデルに基づいており、ユーザは音声サンプルを提供するだけでクローンを作成することができます。

4ヶ月前

0711

PlayHT：超リアルな音声を生成するAIツール

概要 PlayHTは、AI音声生成に特化した効率的なオンラインプラットフォームで、ユーザーがテキストを自然でリアルな音声に素早く変換できるよう支援します。60以上の言語と多様なアクセントをサポートする600以上のAI音声を提供し、ポッドキャスト制作、教育コンテンツ、マーケティングプロモーション...

最新のAIツール # AI音声合成 # AIボイスクローニング

4ヶ月前

0850

Spark-TTS：自然な音声を生成する音声合成ツール

概要 Spark-TTSは、SparkAudioチームによって開発され、GitHubでホストされているオープンソースの音声合成（TTS）ツールで、ユーザーがテキストを自然で滑らかな音声に効率的に変換できるように設計されています。

4ヶ月前

0975

Step-Audio：マルチモーダル音声インタラクションフレームワーク。

包括的な紹介 Step-Audioはオープンソースのインテリジェント音声対話フレームワークであり、制作環境において、すぐに使える音声理解と音声生成機能を提供するように設計されています。このフレームワークは、多言語会話（例：中国語、英語、日本語）、感情音声（例：嬉しい、悲しい）、地域方言（例：広東語、四川語、中国語、英語、日本語）をサポートしています。

5ヶ月前

01.1K

Zonos: 高品質音声合成と音声クローニングツール

一般的な紹介 ZonosはZyphraによって開発されたオープンソースの音声合成と音声クローニングツールです。Zonos-v0.1バージョンは、高品質の音声出力を生成するために高度なトランスフォーマーとブレンドモデルを使用しています。このツールは複数の言語をサポートしています。

5ヶ月前

01.4K

Weights：声真似カバーソングと音声合成オーサリングプラットフォーム

はじめに Weightsは、簡単な操作でボイスカバー、音声合成、画像、音楽、動画を作成できる、AIを活用したクリエイティビティのためのソーシャルプラットフォームです。このプラットフォームは、ユーザーが素早く創作を始め、コミュニティと共有できるよう、豊富なツールやテンプレートを提供しています。

最新のAIツール # AI音声合成 # AIボイスクローニング

6ヶ月前

01.3K

AnyVoice: 無料オンラインボイスクローニング！

概論 AnyVoiceは高度なAI音声生成プラットフォームであり、超リアルな音声生成と音声クローンサービスを提供します。ユーザーはテキストを自然な音声に変換し、数百のプリセット音声から選択することができます。適切な音声が見つからない場合は、...

最新のAIツール # AI音声合成 # AIボイスクローニング

6ヶ月前

01.4K

Llasa 1~8B: 高品質音声生成とクローニングのためのオープンソース音声合成モデル

概要 Llasa-3Bは、香港科学技術大学オーディオ研究室（HKUST Audio）が開発したオープンソースの音声合成（TTS）モデルです。このモデルはLlama 3.2Bアーキテクチャに基づいており、複数の音声合成をサポートするだけでなく、高品質な音声合成を提供するために慎重に調整されています。

5ヶ月前

01.3K

Fish Agent：端到端AI语音克隆助手，实时语音对话助理，Fish Speech衍生项目

フィッシュ・エージェント：エンド・ツー・エンドのAIボイス・クローン・アシスタント、リアルタイム音声対話アシスタント、フィッシュ・スピーチ・スピンオフ・プロジェクト

包括的な紹介フィッシュ・スピーチ派生プロジェクトフィッシュ・エージェントは、V0.1 3Bモデル・アーキテクチャに基づいて開発された、革命的なエンド・ツー・エンドのAIスピーチ・クローン・システムです。完全なエンド・ツー・エンドの音声クローン処理システムとして、その最大の特徴は、革新的なスピーチレス...

6ヶ月前

01.2K

ViiTor AI：音声・映像の多言語翻訳合成と音声クローン作成サービス

総合紹介 ViiTor AIは、高品質な動画翻訳、ボイスクローン、AI生成アバター動画、音声合成サービスの提供に特化した強力な人工知能プラットフォームです。このプラットフォームは多言語をサポートし、ユーザーが簡単に多言語コンテンツ作成を実現できることを目指しています。

7ヶ月前

01.5K

Voicemod：リアルタイムボイスチェンジャー、ボイスチャット、ゲームボイス変更

概要 Voicemodは、WindowsとmacOS用のリアルタイムボイスチェンジャーとサウンドエフェクトソフトウェアのリーディングカンパニーです。ゲームでのロールプレイ、友達とのチャット、ライブストリーミングなど、Voicemodは豊富なボイスチェンジを提供します。

最新のAIツール # AIボイスクローニング

8ヶ月前

01.6K

Amphion MaskGCT: ゼロサンプル音声合成クローンモデル (ローカルのワンクリックデプロイパッケージ)

包括的な紹介 MaskGCT (Masked Generative Codec Transformer)は、Funky Maru Technologyと香港中文大学が共同で導入した完全非自律回帰型音声合成(TTS)モデルである。このモデルは明示的な音声合成を必要としない。

8ヶ月前

01.9K

ファンキー丸千代：声のクローンと口のシンクロを組み合わせ、ワンクリックでビデオを多言語に翻訳！

総合紹介 Funmaru Thousand Voicesは、リアルで自然な音声生成ソリューションを提供する多言語AI音声合成プラットフォームです。ユーザーは、テキストコンテンツを簡単にプロ級の音声に変換することができ、個人のニーズに合わせてゼロサンプルから専用のAIボイス（ボイスクローン）の作成をサポートします。また、このプラットフォームはビデオ翻訳機能も提供し、...

最新のAIツール # AI翻訳 # AIボイスクローニング

7ヶ月前

01.3K

CosyVoice：3秒間の突進ボイス・クローニング・オープンソース・プロジェクトがアリによって立ち上げられる。

包括的な紹介 CosyVoiceは、推論、トレーニングからデプロイまでフルスタックの機能を提供する多言語大規模音声生成モデルです。FunAudioLLMチームによって開発され、高度な自己回帰変換器とODEベースの拡散モデルにより、高品質な音声の実現を目指しています。

5ヶ月前

02.3K

コンクAIビデオジェネレーター：テキストまたは画像から高品質のビデオ、映画、TVグレードの映像作成が可能

概要 Conch AI Video GeneratorはMiniMaxが開発した先進的なAIビデオ生成ツールです。ユーザーは簡単なテキストを入力するか、画像をアップロードするだけで、Conch AIは高品質なビデオコンテンツを素早く生成することができます。このツールは、クリエイター、マーケティング担当者、ストーリー担当者などに広く利用されています。

7ヶ月前

01.8K