FunASR:开源语音识别工具包,说话人分离/ 多人对话语音识别

FunASR: オープンソース音声認識ツールキット、話者分離/多人数対話音声認識

総合紹介 FunASRはAlibaba Dharmo Academyが学術研究と産業応用の橋渡しをするために開発したオープンソースの音声認識ツールキットです。音声認識(ASR)、音声終点検出(VAD)、句読点復元、言語モデリング、スピーキング...など、幅広い音声認識機能をサポートしています。
8ヶ月前
01.6K0
Sherpa-ONNX:使用ONNXRuntime实现离线语音识别和合成

Sherpa-ONNX: ONNXRuntimeによるオフライン音声認識と合成

概要 sherpa-onnxは、Next-gen Kaldiチームによって開発されたオープンソースプロジェクトで、効率的なオフライン音声認識および音声合成ソリューションを提供します。Android、iOS、Raspber...など複数のプラットフォームをサポートしています。
5ヶ月前
01.5K0
Notta:AI会议记录与音频转录工具,自动转录会议、采访或录音

Notta: 会議、インタビュー、録音を自動的に書き起こすAI会議録音・音声書き起こしツール

一般的な説明 Nottaは、ユーザーが自動的に検索可能なテキストに会議、インタビューやオーディオ録音を変換するために設計された強力なAI会議録音と音声転写ツールです。Nottaを使えば、ユーザーは簡単に書き起こし、編集、要約、共同作業を行うことができ、生産性を高めることができます。
5ヶ月前
01.4K0
Zamzar:多功能在线文件格式转换工具,视频转换|音频转换|图片转换|文档转换

Zamzar: 多機能オンラインファイル形式変換ツール, 動画変換, 音声変換, 画像変換, 文書変換

概要 Zamzarは、1200以上のファイル形式をサポートする強力なオンラインファイル変換ツールです。文書、写真、ビデオ、オーディオ、電子ブックなど、Zamzarは迅速かつ効率的に変換できます。ユーザーはソフトウェアをダウンロードする必要はありません。
7ヶ月前
01.4K0
VideoLingo:视频转录单词级时间轴字幕,视频字幕翻译和本地化配音开源工具

VideoLingo: 動画書き起こし単語レベルタイムライン字幕、動画字幕翻訳、ローカライズ吹き替えオープンソースツール

综合介绍 VideoLingo 是一个一站式视频翻译和本地化配音工具,旨在生成 Netflix 级别的高质量字幕,消除生硬的机器翻译和多行字幕,并添加高质量的配音,使全球知识能够跨越语言障碍共享。通过...
7ヶ月前
01.3K0
BetterWhisperX:自动语音识别与说话人分离,提供高精度单词级时间戳

BetterWhisperX:話者から切り離された自動音声認識により、高精度の単語レベルのタイムスタンプを提供

はじめに BetterWhisperXは、効率的で正確な自動音声認識(ASR)サービスを提供することに重点を置いたWhisperXプロジェクトの最適化バージョンです。WhisperXの改良版として、このプロジェクトはFederico ...
5ヶ月前
01.3K0
通义听悟:阿里通义音视频内容转录AI助手

Tongyi Listening and Understanding: Ali Tongyi 音声・動画コンテンツ書き起こしAIアシスタント

综合介绍 通义听悟是阿里云推出的一款工作学习AI助手,专注于音视频内容的转写和分析。它依托阿里云的强大AI模型,能够将音视频内容实时转写成文字,并提供翻译、总结、定位等功能。通义听悟支持多种语言和场景...
9ヶ月前
01.2K0