ウィスパーインプット:Groqを使った無料・高速の音声テキスト起こしサービス概要 Whisper Inputは、Optionボタンを押すことで音声の録音を開始し、ボタンを離すことで録音を終了することができるオープンソースの音声書き起こしツールです。このツールは、Groq Whisper Large V3 Turbo ... を呼び出します。最新のAIツール# AI Java オープンソースプロジェクト# AI音声合成3ヶ月前06940
LiberSonora:オーディオブック字幕抽出と多言語翻訳、オーディオブックの多言語書き起こし包括的な紹介 LiberSonoraは、「自由な音」を意味し、強力なAI対応のオープンソースオーディオブックツールセットです。インテリジェントな字幕抽出、AIタイトル生成、多言語翻訳などをサポートし、GPUアクセラレーションによるバッチオフライン処理が可能です。最新のAIツール# AI Java オープンソースプロジェクト# AI翻訳# AI音声合成4ヶ月前06480
AudioNotes: 音声とビデオコンテンツをすばやく抽出し、構造化されたノートを作成します。総合紹介 AudioNotesは、FunASRとQwen2に基づいて構築された、オーディオ/ビデオから構造化ノートへのシステムです。オーディオ/ビデオコンテンツを素早く抽出し、大きなモデルを呼び出して構造化されたMarkdownノートを生成することができます。最新のAIツール# AI Java オープンソースプロジェクト# AI音声合成4ヶ月前07710
Orate:よく知られた音声生成、音声トランスクリプション、音声モデリングを統合する統一API概要 Orateは、音声生成と文字起こしに特化したAIツールキットです。Orateは、OpenAI、ElevenLabs、AssemblyAIなどの主要なAIプロバイダーとシームレスに統合する統一APIを提供し、ユーザーが強制的に音声を作成できるようにします。最新のAIツール# AI Java オープンソースプロジェクト# AI音声合成# AI音声合成4ヶ月前09210
PengChengStarling: Whisper-Large v3より小型で高速な多言語音声テキスト変換ツール包括的な紹介 PengChengStarling (PengCheng Labs) は、異なる言語の音声を対応するテキストに変換できる多言語自動音声認識 (ASR) ツールです。このツールキットはicefallプロジェクトに基づいて開発され、完全な音声認識プロセスを提供します...最新のAIツール# AI Java オープンソースプロジェクト# AI音声合成4ヶ月前07910
RealtimeSTT: Whisperをベースとした低遅延ストリーミング音声認識のためのリアルタイム音声テキスト変換ツール概論 RealtimeSTTは、高度な音声アクティビティ検出とウェイクワードアクティベーションを備えた、効率的で低レイテンシーのリアルタイム音声テキスト変換ライブラリです。Kolja Beigelによって開発され、高速で正確な音声テキスト変換を必要とするアプリケーションをサポートします。AIニュース# AI Java オープンソースプロジェクト# AI音声合成4ヶ月前01.2K0
Sherpa-ONNX: ONNXRuntimeによるオフライン音声認識と合成概要 sherpa-onnxは、Next-gen Kaldiチームによって開発されたオープンソースプロジェクトで、効率的なオフライン音声認識および音声合成ソリューションを提供します。Android、iOS、Raspber...など複数のプラットフォームをサポートしています。最新のAIツール# AI Java オープンソースプロジェクト# AI音声合成# AI音声合成5ヶ月前01.5K0
Acoust: オンラインAI音声生成・音声合成(TTS)サービスプラットフォーム概要 Acoustは、最新のAI技術を駆使してリアルな音声を生成する、オンラインAI音声生成・音声合成(TTS)サービスプラットフォームです。また、強力なビデオ編集ツールも提供しており、ユーザーは複数のソフトウェアを使用することなくビデオ制作を完了することができます。最新のAIツール# AI音声合成# AI音声合成5ヶ月前09040
Notta: 会議、インタビュー、録音を自動的に書き起こすAI会議録音・音声書き起こしツール一般的な説明 Nottaは、ユーザーが自動的に検索可能なテキストに会議、インタビューやオーディオ録音を変換するために設計された強力なAI会議録音と音声転写ツールです。Nottaを使えば、ユーザーは簡単に書き起こし、編集、要約、共同作業を行うことができ、生産性を高めることができます。最新のAIツール# AIテキストおよび音声/ビデオ要約ツール# AI音声合成5ヶ月前01.4K0
AIの自作組:AIによる映像の多言語字幕の自動生成と翻訳概論 AIの字幕組は、動画字幕の自動抽出、自動文字起こし、自動翻訳を可能にする、強力なコマンドライン動画字幕処理ツールです。このツールには、ウィスパー音声を含む高度なAI技術が統合されています。最新のAIツール# AI Java オープンソースプロジェクト# AI翻訳# AI音声合成5ヶ月前01K0
FunClip:ビデオコンテンツをショートフィルムにインテリジェントに編集。総合紹介 FunClipは、アリババ達磨研究所のTONGYI Speech Labによって開発された、完全オープンソースのローカライズされた自動ビデオ編集ツールです。このツールは、産業グレードのParaformer-Large音声認識モデルを統合し、ビデオ内の音声を正確に識別することができます...最新のAIツール# AI Java オープンソースプロジェクト# AI音声合成# AIオーディオ/ビデオ・エディター5ヶ月前01K0
BetterWhisperX:話者から切り離された自動音声認識により、高精度の単語レベルのタイムスタンプを提供はじめに BetterWhisperXは、効率的で正確な自動音声認識(ASR)サービスを提供することに重点を置いたWhisperXプロジェクトの最適化バージョンです。WhisperXの改良版として、このプロジェクトはFederico ...最新のAIツール# AI Java オープンソースプロジェクト# AI音声合成5ヶ月前01.3K0
フリード:医師と患者の会話を正確に書き起こし、診察記録の事務作業を軽減するAI医療記録アシスタント概要 Freedは、医療従事者向けに設計されたAI医療記録アシスタントです。高度なAI技術により、医師をはじめとする医療従事者の診察記録の自動化、ペーパーワークの削減、作業効率の向上を支援します。FreedのAIテープ起こし...最新のAIツール# AI音声合成5ヶ月前01.1K0
Voicenotes:AI音声メモ、音声録音・書き起こし、会議内容のインテリジェント管理一般的な紹介 Voicenotesは、ユーザーが簡単に音声メモや会議を記録し、管理するために設計されたスマートな音声メモアプリです。ユーザーは自分の考えを話すだけで、Voicenotesが自動的にテキストに書き起こします。最新のAIツール# AIノート# AI音声合成5ヶ月前01.2K0
Voice-Pro: オープンソースの多機能ビデオ翻訳ツール、多言語への音声書き起こしおよび翻訳、Windowsワンクリックインストール概論 Voice-Proは、Gradio WebUIをベースにした多機能ツールで、音声合成、テキスト読み上げ、リアルタイム翻訳、YouTubeビデオダウンロード、人声分離をサポートします。Whisper、Faster-Wh...最新のAIツール# AI Java オープンソースプロジェクト# AI翻訳# AI音声合成6ヶ月前01.2K0
Zamzar: 多機能オンラインファイル形式変換ツール, 動画変換, 音声変換, 画像変換, 文書変換概要 Zamzarは、1200以上のファイル形式をサポートする強力なオンラインファイル変換ツールです。文書、写真、ビデオ、オーディオ、電子ブックなど、Zamzarは迅速かつ効率的に変換できます。ユーザーはソフトウェアをダウンロードする必要はありません。最新のAIツール# AIオープンサービス# AI音声合成7ヶ月前01.4K0
AI Hear:オフラインでネイティブに動作するリアルタイム音声書き起こし・翻訳ソフトウェア概要 MacBookをお使いの方は、AI Hearをお試しください。音声を録音し、リアルタイムで現地の音声をテキストに変換し、翻訳し、最終的には字幕を書き出すことができます。国をまたいだ会議や英語のオーディオブックのリスニングをサポートします。 AI Hearはローカルで動作するソフトウェアで、ワンクリックでリアルタイムの...最新のAIツール# AI翻訳# AI音声合成7ヶ月前01.2K0
SoniTranslate: オープンソース動画翻訳ダビングソリューション、複数ダビング、速度調整、オリジナルサウンドの模倣概要 SoniTranslate はパワフルでユーザーフレンドリーなビデオ多言語ダビングツールです。高度な音声認識と機械翻訳技術により、ビデオ コンテンツを多言語に翻訳し、音声を同期させます。この ...最新のAIツール# AI音声合成# AI翻訳# AI音声合成7ヶ月前02.4K0
FunASR: オープンソース音声認識ツールキット、話者分離/多人数対話音声認識総合紹介 FunASRはAlibaba Dharmo Academyが学術研究と産業応用の橋渡しをするために開発したオープンソースの音声認識ツールキットです。音声認識(ASR)、音声終点検出(VAD)、句読点復元、言語モデリング、スピーキング...など、幅広い音声認識機能をサポートしています。最新のAIツール# AI Java オープンソースプロジェクト# AI音声合成8ヶ月前01.6K0