Meeting:本地实时转录和生成会议纪要的开源客户端

ミーティング:オープンソース・クライアントのローカル・リアルタイム文字起こしおよび議事録作成

一般的な紹介 Meeting Minutes(別名Meetily)は、Zackriya Solutionsによって開発されたフリーでオープンソースのAIミーティングアシスタントツールで、リアルタイムでミーティングの音声をキャプチャし、書き起こしテキストを生成し、自動的にミーティングを抽出することに重点を置いています...
3ヶ月前
05930
WhisperChain:实时语音转文字并优化口语化词语

WhisperChain:リアルタイム音声テキスト化と話し言葉の最適化

概論 WhisperChainはGitHubでホストされているAIベースのオープンソースプロジェクトで、開発者のクリス・チョイが主導している。主に音声をテキストに変換し、AI技術によって自動的に表現を最適化し、冗長な部分を削除するために使用される。
3ヶ月前
05540
AssemblyAI:高精度语音转文字与音频智能分析平台

AssemblyAI:高精度音声テキスト・音声インテリジェンス分析プラットフォーム

一般的な紹介 AssemblyAIは音声AI技術に特化したプラットフォームで、開発者や企業に効率的な音声テキストおよび音声分析ツールを提供しています。その中心的なハイライトは、Universalシリーズのモデル、特に新しくリリースされたUniversal-2...
3ヶ月前
05500
Local-NotebookLM:本地PDF生成语音播客的开源工具

Local-NotebookLM: オープンソースツールの音声ポッドキャストを生成するローカルPDF

概要 Local-NotebookLMはオープンソースプロジェクトで、ローカルで動作するインテリジェントな文書処理とコンテンツ生成ツールを提供することを目的としています。Google NotebookLMにインスパイアされ、ユーザーがPDFやその他のドキュメントを様々な...
3ヶ月前
04770
Aqua Voice:跨应用语音输入生成精准文本

アクアボイス:アプリケーションを横断した音声入力で正確なテキストを生成する

一般的な紹介 Aqua Voiceは、スマートな音声ベースのテキスト生成ツールで、ユーザーの発話をフォーマットされたテキストに素早く変換することに重点を置いている。2023年にフィニアン・ブラウンとジャック・マッキンタイアによって開発され、米国を拠点としている。
2ヶ月前
03910
Dolphin:面向亚洲语言识别与语音转文本模型

ドルフィン:アジア言語認識とアジア言語のための音声テキストモデル

総合紹介 Dolphinは、DataoceanAIと清華大学によって開発された、アジア言語の音声認識と言語認識に特化したオープンソースモデルです。東アジア、南アジア、東南アジア、中東の40の言語と22の中国語方言をサポートしています。
2ヶ月前
03670
Transkriptor:将音频和视频转为文字的AI智能转录工具

Transkriptor:音声とビデオをテキストに変換するAIスマート書き起こしツール

概 要 TranskriptorはAIを活用したテープ起こしツールで、音声や動画を素早くテキストに変換します。最大99%の精度で100以上の言語に対応しており、会議やインタビュー、授業ノートなど、さまざまな場面でご利用いただけます。ユーザーはファイルをアップロードしたり、直接...
2ヶ月前
03430
Otter.ai:智能会议助手与实时语音转录工具

Otter.ai:リアルタイム音声書き起こしツールを備えたインテリジェントな会議アシスタント

概要 Otter.aiはAIを搭載した会議管理・音声書き起こしツールで、音声をリアルタイムでテキストに変換し、会議メモ、サマリー、アクションアイテムを自動生成するコア機能を備えています。AIミーティングエージェントによってインテリジェントにサポートされ、自動的に...
2ヶ月前
03250
TurboScribe:快速将音频和视频转为文字的在线工具

TurboScribe: オーディオやビデオを素早くテキストに変換するオンラインツール

概要 TurboScribeはAIベースのテープ起こしツールで、音声やビデオを素早くテキストに変換することに重点を置いています。98以上の言語をサポートし、99.8%の精度を持つため、音声コンテンツを効率的に処理する必要があるユーザーに適しています。ユーザーはファイルをアップロードしたり、テキストメモを生成したりすることができます...
2ヶ月前
03110
实时语音转文字的开源工具

リアルタイム音声テキスト化のためのオープンソースツール

概要 realtime-transcription-fastrtcは、音声をリアルタイムでテキストに変換することに特化したオープンソースプロジェクトです。FastRTC技術を使って低遅延の音声ストリームを処理し、ローカルのWhisperモデルと組み合わせて効率的なテキスト変換を実現します。
2ヶ月前
03050
Vexa:实时会议转录与智能知识提取工具

Vexa:リアルタイム会議記録・インテリジェント知識抽出ツール

包括的な紹介 Vexaはオープンソースのリアルタイム会議記録および知識管理プラットフォームで、効率的な会議記録とインテリジェントな知識抽出サービスを企業や個人に提供するように設計されています。API駆動の会議ロボットにより、Google MeetやZoomなどのプラットフォームに自動的に参加します。
1ヶ月前
02860
On Device AI:iPhone本地运行的AI语音转录与聊天工具

オンデバイスAI:iPhoneネイティブ対応のAI音声書き起こし&チャットツール

一般的な紹介 On-Device AIは、完全にオフラインで動作するAIアプリで、iOS、macOS、およびvisionOSをサポートするAppleデバイス向けに設計されています。ローカルの大規模言語モデル(LLM)の実行、リアルタイムの音声転写、文書分析などを、リンクすることなく提供します。
1ヶ月前
02740
Kimi-Audio:开源音频处理与对话基础模型

Kimi-Audio:オープンソースの音声処理と対話ベースモデル

一般的な紹介 Kimi-Audioは、Moonshot AIによって開発されたオープンソースの音声ベースモデルで、音声の理解、生成、対話に焦点を当てています。音声認識、音声Q&A、音声感情認識など、幅広い音声処理タスクをサポートしています。このモデルは130以上のテストが行われています。
1ヶ月前
02720
Abogen:将多种文本格式转换为有声读物的工具

Abogen:複数のテキスト形式をオーディオブックに変換するツール

一般的な紹介 Abogenは、ePub、PDF、またはプレーンテキストファイルを高品質な音声に素早く変換するために設計されたオープンソースツールです。自然で滑らかな音声を生成するためにKokoro-82Mモデルを使用し、同時字幕生成もサポートしているので、オーディオブックの制作に適しています...
1ヶ月前
02290