AI文本转语音 - 第5页

順番に並べる

Kimi-Audio：オープンソースの音声処理と対話ベースモデル

一般的な紹介 Kimi-Audioは、Moonshot AIによって開発されたオープンソースの音声ベースモデルで、音声の理解、生成、対話に焦点を当てています。音声認識、音声Q&A、音声感情認識など、幅広い音声処理タスクをサポートしています。このモデルは130以上のテストが行われています。

1ヶ月前

02830

Muyan-TTS：パーソナライズされたポッドキャストの音声トレーニングと合成

Synthesis Muyan-TTSは、ポッドキャスティングシナリオ用に設計されたオープンソースのテキスト音声合成（TTS）モデルです。100,000時間以上のポッドキャストオーディオデータで事前にトレーニングされており、ゼロサンプル音声合成をサポートし、高品質の自然な音声を生成します。このモデルはLlama-3.2-3...をベースにしています。

1ヶ月前

02550

Audibit：人気の技術記事をすぐに聴ける音声ポッドキャストにする

一般的な紹介 Audibitはオープンソースプロジェクトで、主な機能は、ハッカーニュース、TechCrunchや他の人気のある技術記事を自動的にオーディオポッドキャストに変換することです。このプロジェクトは...

1ヶ月前

02470

そうではない。

AI音声合成

Kimi-Audio：オープンソースの音声処理と対話ベースモデル

Muyan-TTS：パーソナライズされたポッドキャストの音声トレーニングと合成

Audibit：人気の技術記事をすぐに聴ける音声ポッドキャストにする