Whisper Input:利用Groq免费且高速的语音转录文本服务综合介绍 Whisper Input 是一个开源的语音转译工具,用户可以通过按下 Option 按钮开始录制语音,抬起按钮结束录制。该工具调用 Groq Whisper Large V3 Turbo ...最新AI工具# AI开源项目# AI语音转文本3个月前06930
LiberSonora:有声书字幕提取与多语言翻译,有声小说转录为多语言综合介绍 LiberSonora,寓意“自由的声音”,是一个AI赋能的强大开源有声书工具集。该工具集支持智能字幕提取、AI标题生成、多语言翻译等功能,能够在GPU加速下进行批量离线处理。LiberSo...最新AI工具# AI开源项目# AI翻译# AI语音转文本4个月前06480
AudioNotes:快速提取音视频内容并生成结构化笔记综合介绍 AudioNotes 是一个基于 FunASR 和 Qwen2 构建的音视频转结构化笔记系统。它能够快速提取音视频内容,并调用大模型进行整理,生成一份结构化的 Markdown 笔记,方便用...最新AI工具# AI开源项目# AI语音转文本4个月前07660
Orate:集成知名语音生成、语音转录与变声模型的统一API综合介绍 Orate 是一个专注于语音生成与转录的人工智能工具包。它提供了一个统一的API,能够与领先的AI提供商(如OpenAI、ElevenLabs和AssemblyAI)无缝集成,帮助用户创建逼...最新AI工具# AI开源项目# AI文本转语音# AI语音转文本4个月前09120
PengChengStarling:对比Whisper-Large v3更小、更快的多语言语音转文字工具综合介绍 PengChengStarling(鹏城实验室)是一个多语言自动语音识别(ASR)工具,能够将不同语言的语音转换为对应的文本。这个工具包基于icefall项目开发,提供了完整的语音识别流程...最新AI工具# AI开源项目# AI语音转文本4个月前07880
RealtimeSTT:实时语音转文字工具,基于Whisper实现低延迟流式语音识别综合介绍 RealtimeSTT 是一个高效、低延迟的实时语音转文字库,具备先进的语音活动检测和唤醒词激活功能。该项目由 Kolja Beigel 开发,旨在为需要快速、准确语音转文字的应用提供支持...AI新闻# AI开源项目# AI语音转文本4个月前01.2K0
Sherpa-ONNX:使用ONNXRuntime实现离线语音识别和合成综合介绍 sherpa-onnx 是由 Next-gen Kaldi 团队开发的一个开源项目,旨在提供高效的离线语音识别和语音合成解决方案。它支持多种平台,包括 Android、iOS、Raspber...最新AI工具# AI开源项目# AI文本转语音# AI语音转文本5个月前01.5K0
Acoust:在线AI语音生成和文本转语音(TTS)服务平台综合介绍 Acoust 是一个在线 AI 语音生成和文本转语音(TTS)服务平台,利用最新的 AI 技术生成逼真的语音。该平台还提供强大的视频编辑工具,使用户无需使用多种软件即可完成视频制作。Acou...最新AI工具# AI文本转语音# AI语音转文本5个月前09030
Notta:AI会议记录与音频转录工具,自动转录会议、采访或录音综合介绍 Notta是一款功能强大的AI会议记录与音频转录工具,旨在帮助用户自动将会议、采访或录音转化为可搜索的文本。通过Notta,用户可以轻松地转录、编辑、总结和协作,提升工作效率。Notta支持...最新AI工具# AI文本与音频/视频总结工具# AI语音转文本5个月前01.4K0
AI no jimaku gumi:借助AI实现视频多语言字幕自动生成和翻译综合介绍 AI no jimaku gumi(AI の字幕組)是一个强大的命令行视频字幕处理工具,专注于实现自动化的视频字幕提取、转录和翻译功能。该工具集成了先进的AI技术,包括 Whisper 语音...最新AI工具# AI开源项目# AI翻译# AI语音转文本5个月前01K0
FunClip:智能剪辑视频内容为短片,轻松实现精准视频片段提取/裁剪综合介绍 FunClip是一款完全开源的本地化自动视频剪辑工具,由阿里巴巴达摩院TONGYI语音实验室开发。该工具集成了工业级的 Paraformer-Large 语音识别模型,可以准确识别视频中的语...最新AI工具# AI开源项目# AI语音转文本# AI音视频编辑5个月前01K0
BetterWhisperX:自动语音识别与说话人分离,提供高精度单词级时间戳综合介绍 BetterWhisperX 是一个基于 WhisperX 项目的优化版本,专注于提供高效、准确的自动语音识别(ASR)服务。作为 WhisperX 的改进分支,该项目由 Federico ...最新AI工具# AI开源项目# AI语音转文本5个月前01.3K0
Freed:AI医疗抄写助手,准确转录医生和患者对话,减少就诊记录文书工作综合介绍 Freed 是一款专为医疗专业人士设计的 AI 医疗抄写助手。它通过先进的人工智能技术,帮助医生和其他医疗从业者自动记录患者的就诊信息,减少文书工作,提高工作效率。Freed 的 AI 抄写...最新AI工具# AI语音转文本5个月前01.1K0
Voicenotes:AI语音笔记,记录与转录语音,智能管理会议内容综合介绍 Voicenotes 是一款智能语音笔记应用,旨在帮助用户轻松记录和管理语音笔记及会议内容。该应用支持100多种语言的语音转录,用户只需说出想法,Voicenotes 即可自动将其转录为文字...最新AI工具# AI笔记# AI语音转文本5个月前01.2K0
Voice-Pro:开源多功能视频翻译工具,语音转录并翻译为多语言,Windows一键安装综合介绍 Voice-Pro 是一个基于 Gradio WebUI 的多功能工具,支持语音转文字、文本转语音、实时翻译、YouTube 视频下载和人声分离。它集成了 Whisper、Faster-Wh...最新AI工具# AI开源项目# AI翻译# AI语音转文本6个月前01.2K0
Zamzar:多功能在线文件格式转换工具,视频转换|音频转换|图片转换|文档转换综合介绍 Zamzar 是一个功能强大的在线文件转换工具,支持超过 1200 种文件格式的转换。无论是文档、图片、视频、音频还是电子书,Zamzar 都能快速高效地完成转换任务。用户无需下载任何软件...最新AI工具# AI开放服务# AI语音转文本7个月前01.4K0
AI Hear:本地离线运行的实时语音转录与翻译软件综合介绍 如果你在用 MacBook,试试 AI Hear:可以录音、实时本地语音转文字、并翻译、最终导出字幕。可以用它辅助你听跨国会议、英文有声书。 AI Hear是一款本地运行的软件,提供一键实时...最新AI工具# AI翻译# AI语音转文本7个月前01.2K0
SoniTranslate:开源视频翻译配音解决方案,多人配音、调整语速与模仿原声综合介绍 SoniTranslate 是一个强大且用户友好的视频多语言配音工具,旨在提供视频翻译和同步音频的解决方案。它利用先进的语音识别和机器翻译技术,将视频内容翻译成多种语言,并保持音频同步。该项...最新AI工具# AI文本转语音# AI翻译# AI语音转文本7个月前02.4K0
FunASR:开源语音识别工具包,说话人分离/ 多人对话语音识别综合介绍 FunASR是一个由阿里巴巴达摩院开发的开源语音识别工具包,旨在为学术研究和工业应用提供桥梁。它支持多种语音识别功能,包括语音识别(ASR)、语音端点检测(VAD)、标点恢复、语言模型、说话...最新AI工具# AI开源项目# AI语音转文本8个月前01.6K0