Kimi-Audio:オープンソースの音声処理と対話ベースモデル一般的な紹介 Kimi-Audioは、Moonshot AIによって開発されたオープンソースの音声ベースモデルで、音声の理解、生成、対話に焦点を当てています。音声認識、音声Q&A、音声感情認識など、幅広い音声処理タスクをサポートしています。このモデルは130以上のテストが行われています。最新のAIツール# AI Java オープンソースプロジェクト# AI音声合成# AI音声合成1ヶ月前02830
Muyan-TTS:パーソナライズされたポッドキャストの音声トレーニングと合成Synthesis Muyan-TTSは、ポッドキャスティングシナリオ用に設計されたオープンソースのテキスト音声合成(TTS)モデルです。100,000時間以上のポッドキャストオーディオデータで事前にトレーニングされており、ゼロサンプル音声合成をサポートし、高品質の自然な音声を生成します。このモデルはLlama-3.2-3...をベースにしています。最新のAIツール# AI Java オープンソースプロジェクト# AI音声合成1ヶ月前02550
Audibit:人気の技術記事をすぐに聴ける音声ポッドキャストにする一般的な紹介 Audibitはオープンソースプロジェクトで、主な機能は、ハッカーニュース、TechCrunchや他の人気のある技術記事を自動的にオーディオポッドキャストに変換することです。このプロジェクトは...最新のAIツール# AI Java オープンソースプロジェクト# AI音声合成1ヶ月前02470