AI语音转文本 - 第3页

順番に並べる

CapsWriter-Offline：PC用音声入力・字幕書き起こしツール

概要 CapsWriter-Offlineは、GitHubでホストされており、開発者HaujetZhaoによって構築されたPC用の音声入力および字幕書き起こしツールです。完全にオフラインで動作するため、インターネット接続を必要とせず、音声入力やオーディオビジュアル...

3ヶ月前

06050

ミーティング：オープンソース・クライアントのローカル・リアルタイム文字起こしおよび議事録作成

一般的な紹介 Meeting Minutes（別名Meetily）は、Zackriya Solutionsによって開発されたフリーでオープンソースのAIミーティングアシスタントツールで、リアルタイムでミーティングの音声をキャプチャし、書き起こしテキストを生成し、自動的にミーティングを抽出することに重点を置いています...

3ヶ月前

05930

FireRedASR：多言語高精度音声認識のためのオープンソースモデル

一般的な紹介 FireRedASRは、Little Red Book FireRedチームによって開発され、オープンソース化された音声認識モデルです。このプロジェクトは開発者や研究者向けにGitHubでホストされており、...

3ヶ月前

05650

WhisperChain：リアルタイム音声テキスト化と話し言葉の最適化

概論 WhisperChainはGitHubでホストされているAIベースのオープンソースプロジェクトで、開発者のクリス・チョイが主導している。主に音声をテキストに変換し、AI技術によって自動的に表現を最適化し、冗長な部分を削除するために使用される。

3ヶ月前

05540

AssemblyAI：高精度音声テキスト・音声インテリジェンス分析プラットフォーム

一般的な紹介 AssemblyAIは音声AI技術に特化したプラットフォームで、開発者や企業に効率的な音声テキストおよび音声分析ツールを提供しています。その中心的なハイライトは、Universalシリーズのモデル、特に新しくリリースされたUniversal-2...

最新のAIツール # AIオープンサービス # AI音声合成

3ヶ月前

05500

Wispr Flow: どんなアプリケーションでも音声で素早くテキスト入力

一般的な説明 Wispr Flowは音声でテキストを入力するツールで、ユーザーがコンピューターで素早く文章を書くことを支援します。タイピングの3倍の速さ」で、Word、Slack、G...などあらゆるアプリケーションにテキストを入力できます。

最新のAIツール # AI音声合成

2ヶ月前

04980

Local-NotebookLM: オープンソースツールの音声ポッドキャストを生成するローカルPDF

概要 Local-NotebookLMはオープンソースプロジェクトで、ローカルで動作するインテリジェントな文書処理とコンテンツ生成ツールを提供することを目的としています。Google NotebookLMにインスパイアされ、ユーザーがPDFやその他のドキュメントを様々な...

3ヶ月前

04770

アクアボイス：アプリケーションを横断した音声入力で正確なテキストを生成する

一般的な紹介 Aqua Voiceは、スマートな音声ベースのテキスト生成ツールで、ユーザーの発話をフォーマットされたテキストに素早く変換することに重点を置いている。2023年にフィニアン・ブラウンとジャック・マッキンタイアによって開発され、米国を拠点としている。

最新のAIツール # AI音声合成

2ヶ月前

03910

ドルフィン：アジア言語認識とアジア言語のための音声テキストモデル

総合紹介 Dolphinは、DataoceanAIと清華大学によって開発された、アジア言語の音声認識と言語認識に特化したオープンソースモデルです。東アジア、南アジア、東南アジア、中東の40の言語と22の中国語方言をサポートしています。

2ヶ月前

03670

TwinMind: 無料オフライン音声テキスト変換アプリ

TwinMindは、ThirdEar AI, Inc.によって開発された、「すべてを記憶するのに役立つ」スマートツールです。携帯電話をポケットに入れたままでも、会話や会議、講義をリアルタイムで録音し、100以上の言語でテキスト化することができます。

2ヶ月前

03610

Transkriptor：音声とビデオをテキストに変換するAIスマート書き起こしツール

概要 TranskriptorはAIを活用したテープ起こしツールで、音声や動画を素早くテキストに変換します。最大99%の精度で100以上の言語に対応しており、会議やインタビュー、授業ノートなど、さまざまな場面でご利用いただけます。ユーザーはファイルをアップロードしたり、直接...

2ヶ月前

03430

Otter.ai：リアルタイム音声書き起こしツールを備えたインテリジェントな会議アシスタント

概要 Otter.aiはAIを搭載した会議管理・音声書き起こしツールで、音声をリアルタイムでテキストに変換し、会議メモ、サマリー、アクションアイテムを自動生成するコア機能を備えています。AIミーティングエージェントによってインテリジェントにサポートされ、自動的に...

2ヶ月前

03250

TurboScribe: オーディオやビデオを素早くテキストに変換するオンラインツール

概要 TurboScribeはAIベースのテープ起こしツールで、音声やビデオを素早くテキストに変換することに重点を置いています。98以上の言語をサポートし、99.8%の精度を持つため、音声コンテンツを効率的に処理する必要があるユーザーに適しています。ユーザーはファイルをアップロードしたり、テキストメモを生成したりすることができます...

最新のAIツール # AI音声合成

2ヶ月前

03110

リアルタイム音声テキスト化のためのオープンソースツール

概要 realtime-transcription-fastrtcは、音声をリアルタイムでテキストに変換することに特化したオープンソースプロジェクトです。FastRTC技術を使って低遅延の音声ストリームを処理し、ローカルのWhisperモデルと組み合わせて効率的なテキスト変換を実現します。

2ヶ月前

03050

Vexa：リアルタイム会議記録・インテリジェント知識抽出ツール

包括的な紹介 Vexaはオープンソースのリアルタイム会議記録および知識管理プラットフォームで、効率的な会議記録とインテリジェントな知識抽出サービスを企業や個人に提供するように設計されています。API駆動の会議ロボットにより、Google MeetやZoomなどのプラットフォームに自動的に参加します。

1ヶ月前

02860