录咖:一站式音视频处理平台|视频生成|AI字幕|提取音频|语音转文字

Record Cafe: ワンストップ音声・映像処理プラットフォーム|動画生成|AI字幕|音声抽出|音声テキスト化

综合介绍 录咖是一站式音视频处理平台,提供AI视频对话、AI字幕和AI语音转文字服务。功能包括录制屏幕、剪辑视频、转换GIF/音频等,并支持云存储与分享。界面直观,使用方便,还支持多屏幕录制和多语种智...
6ヶ月前
01.2K0
Voice-Pro:开源多功能视频翻译工具,语音转录并翻译为多语言,Windows一键安装

Voice-Pro: オープンソースの多機能ビデオ翻訳ツール、多言語への音声書き起こしおよび翻訳、Windowsワンクリックインストール

概論 Voice-Proは、Gradio WebUIをベースにした多機能ツールで、音声合成、テキスト読み上げ、リアルタイム翻訳、YouTubeビデオダウンロード、人声分離をサポートします。Whisper、Faster-Wh...
6ヶ月前
01.2K0
RealtimeSTT:实时语音转文字工具,基于Whisper实现低延迟流式语音识别

RealtimeSTT: Whisperをベースとした低遅延ストリーミング音声認識のためのリアルタイム音声テキスト変換ツール

概論 RealtimeSTTは、高度な音声アクティビティ検出とウェイクワードアクティベーションを備えた、効率的で低レイテンシーのリアルタイム音声テキスト変換ライブラリです。Kolja Beigelによって開発され、高速で正確な音声テキスト変換を必要とするアプリケーションをサポートします。
5ヶ月前
01.2K0
AI Hear:本地离线运行的实时语音转录与翻译软件

AI Hear:オフラインでネイティブに動作するリアルタイム音声書き起こし・翻訳ソフトウェア

概要 MacBookをお使いの方は、AI Hearをお試しください。音声を録音し、リアルタイムで現地の音声をテキストに変換し、翻訳し、最終的には字幕を書き出すことができます。国をまたいだ会議や英語のオーディオブックのリスニングをサポートします。 AI Hearはローカルで動作するソフトウェアで、ワンクリックでリアルタイムの...
7ヶ月前
01.2K0
Murf AI:变声大师|语音转文本|文本生成语音|音频编辑器

Murf AI: ボイスチェンジャー|音声テキスト|テキストから音声へ|音声エディター

一般的な紹介 Murf AIは、テキストを人間に近い音声に変換する、強力なオンライン人工知能音声生成ツールです。最大120以上のAI音声オプションを提供し、20以上の言語をサポートし、ポッドキャスト、ビデオ、プロのプレゼンテーションなど様々な状況に適しています。
8ヶ月前
01.2K0
FunClip:智能剪辑视频内容为短片,轻松实现精准视频片段提取/裁剪

FunClip:ビデオコンテンツをショートフィルムにインテリジェントに編集。

総合紹介 FunClipは、アリババ達磨研究所のTONGYI Speech Labによって開発された、完全オープンソースのローカライズされた自動ビデオ編集ツールです。このツールは、産業グレードのParaformer-Large音声認識モデルを統合し、ビデオ内の音声を正確に識別することができます...
5ヶ月前
01K0
Orate:集成知名语音生成、语音转录与变声模型的统一API

Orate:よく知られた音声生成、音声トランスクリプション、音声モデリングを統合する統一API

概要 Orateは、音声生成と文字起こしに特化したAIツールキットです。Orateは、OpenAI、ElevenLabs、AssemblyAIなどの主要なAIプロバイダーとシームレスに統合する統一APIを提供し、ユーザーが強制的に音声を作成できるようにします。
4ヶ月前
09340
Acoust:在线AI语音生成和文本转语音(TTS)服务平台

Acoust: オンラインAI音声生成・音声合成(TTS)サービスプラットフォーム

概要 Acoustは、最新のAI技術を駆使してリアルな音声を生成する、オンラインAI音声生成・音声合成(TTS)サービスプラットフォームです。また、強力なビデオ編集ツールも提供しており、ユーザーは複数のソフトウェアを使用することなくビデオ制作を完了することができます。
5ヶ月前
09170
LLPlayer:生成实时字幕并双语翻译的视频播放器

LLPlayer: 対訳付きリアルタイム字幕を生成するビデオプレーヤー

概要 LLPlayerはGitHubでホストされている、開発者umlx5hによって作成された言語学習者のためのオープンソースメディアプレーヤーです。バイリンガル字幕表示、AI自動生成字幕、リアルタイム翻訳、単語検索など様々な便利な機能が統合されています。
2ヶ月前
08110
PengChengStarling:对比Whisper-Large v3更小、更快的多语言语音转文字工具

PengChengStarling: Whisper-Large v3より小型で高速な多言語音声テキスト変換ツール

包括的な紹介 PengChengStarling (PengCheng Labs) は、異なる言語の音声を対応するテキストに変換できる多言語自動音声認識 (ASR) ツールです。このツールキットはicefallプロジェクトに基づいて開発され、完全な音声認識プロセスを提供します...
4ヶ月前
08000
AudioNotes:快速提取音视频内容并生成结构化笔记

AudioNotes: 音声とビデオコンテンツをすばやく抽出し、構造化されたノートを作成します。

総合紹介 AudioNotesは、FunASRとQwen2に基づいて構築された、オーディオ/ビデオから構造化ノートへのシステムです。オーディオ/ビデオコンテンツを素早く抽出し、大きなモデルを呼び出して構造化されたMarkdownノートを生成することができます。
4ヶ月前
07850
Whisper Input:利用Groq免费且高速的语音转录文本服务

ウィスパーインプット:Groqを使った無料・高速の音声テキスト起こしサービス

概要 Whisper Inputは、Optionボタンを押すことで音声の録音を開始し、ボタンを離すことで録音を終了することができるオープンソースの音声書き起こしツールです。このツールは、Groq Whisper Large V3 Turbo ... を呼び出します。
4ヶ月前
07040
LiberSonora:有声书字幕提取与多语言翻译,有声小说转录为多语言

LiberSonora:オーディオブック字幕抽出と多言語翻訳、オーディオブックの多言語書き起こし

包括的な紹介 LiberSonoraは、「自由な音」を意味し、強力なAI対応のオープンソースオーディオブックツールセットです。インテリジェントな字幕抽出、AIタイトル生成、多言語翻訳などをサポートし、GPUアクセラレーションによるバッチオフライン処理が可能です。
4ヶ月前
06580