AI语音转文本

in Ordnung bringen

Beitrag Update überfliegen Anerkennung

Abogen: ein Tool zur Konvertierung verschiedener Textformate in Hörbücher

综合介绍 Abogen 是一个开源工具，专为将 ePub、PDF 或纯文本文件快速转换为高质量音频而设计。它使用 Kokoro-82M 模型生成自然流畅的语音，同时支持同步字幕生成，适合制作有声读物...

vor 2 Monaten

0505

Kimi-Audio: Open-Source-Audioverarbeitung und Dialogbasis-Modell

Allgemeine Einführung Kimi-Audio ist ein Open-Source-Audiobasismodell, das von Moonshot AI entwickelt wurde und sich auf Audioverstehen, -erzeugung und -dialog konzentriert. Es unterstützt eine breite Palette von Audioverarbeitungsaufgaben wie Spracherkennung, Audio-Q&A und Sprach-Emotionserkennung. Das Modell wurde über 130 Mal getestet...

Neueste AI-Tools # AI Java Open Source Projekt # AI Text-to-Speech # AI Sprachausgabe in Text

vor 2 Monaten

0542

On Device AI: AI-Sprachtranskription und Chat-Tool für iPhone Native Running

综合介绍 On-Device AI 是一款完全离线运行的AI应用，专为苹果设备设计，支持iOS、macOS和visionOS。它提供本地大型语言模型（LLM）运行、实时语音转录、文档分析等功能，无需联...

Neueste AI-Tools # AI Lokalisierte Chat-Anwendung # AI Sprachausgabe in Text

vor 2 Monaten

0520

Vexa: ein Tool zur Echtzeit-Transkription von Sitzungen und zur intelligenten Wissensextraktion

Umfassende Einführung Vexa ist eine Open-Source-Plattform für die Echtzeit-Transkription von Meetings und das Wissensmanagement, die entwickelt wurde, um effiziente Meeting-Aufzeichnungen und intelligente Wissensextraktionsdienste für Unternehmen und Privatpersonen bereitzustellen. Sie verbindet sich automatisch mit Plattformen wie Google Meet, Zoom usw. durch API-gesteuerte Meeting-Roboter...

Neueste AI-Tools # AI Java Open Source Projekt # KI-Tool zur Zusammenfassung von Text und Audio/Video # AI Sprachausgabe in Text

vor 3 Monaten

0519

Open-Source-Tool für Sprache in Text in Echtzeit

综合介绍 realtime-transcription-fastrtc 是一个开源项目，专注于将语音实时转换为文字。它利用 FastRTC 技术处理低延迟音频流，结合本地 Whisper 模型实现高效...

Neueste AI-Tools # AI Java Open Source Projekt # AI Sprachausgabe in Text

vor 3 Monaten

0522

Transkriptor: das intelligente KI-Transkriptionstool, das Audio und Video in Text umwandelt

综合介绍 Transkriptor 是一个人工智能驱动的转录工具，专注于将音频和视频快速转为文字。它支持超过100种语言，准确率高达99%，适用于会议、采访、课堂笔记等多种场景。用户可以上传文件、直接...

Neueste AI-Tools # KI-Tool zur Zusammenfassung von Text und Audio/Video # AI Übersetzung # AI Sprachausgabe in Text

vor 3 Monaten

0655

Otter.ai: Intelligenter Meeting-Assistent mit Echtzeit-Sprachtranskriptionstool

综合介绍 Otter.ai 是一个人工智能驱动的会议管理与语音转录工具，核心功能是将语音实时转为文字，并自动生成会议笔记、摘要和行动项。它通过 AI Meeting Agent 提供智能支持，能自动加...

Neueste AI-Tools # KI-Tool zur Zusammenfassung von Text und Audio/Video # AI Sprachausgabe in Text

vor 3 Monaten

0636

TurboScribe: das Online-Tool für die schnelle Umwandlung von Audio und Video in Text

综合介绍 TurboScribe 是一个基于人工智能的转录工具，专注于将音频和视频快速转为文字。它支持超过98种语言，准确率高达99.8%，适合需要高效处理语音内容的用户。用户可以上传文件，生成文字记...

Neueste AI-Tools # AI Sprachausgabe in Text

vor 3 Monaten

0528

Aqua Voice: Akkurate Texterzeugung mit anwendungsübergreifender Spracheingabe

综合介绍 Aqua Voice 是一个基于语音的智能文本生成工具，专注于将用户语音快速转化为格式化文本。它由 Finnian Brown 和 Jack McIntire 创建于2023年，总部位于美国...

Neueste AI-Tools # AI Sprachausgabe in Text

vor 3 Monaten

0608

Dolphin: Asiatische Spracherkennung und Speech-to-Text-Modelle für asiatische Sprachen

Umfassende Einführung Dolphin ist ein Open-Source-Modell, das von DataoceanAI und der Tsinghua-Universität entwickelt wurde und sich auf Spracherkennung und Spracherkennung für asiatische Sprachen konzentriert. Es unterstützt 40 Sprachen in Ostasien, Südasien, Südostasien und dem Nahen Osten sowie 22 chinesische Dialekte...

Neueste AI-Tools # AI Java Open Source Projekt # AI Sprachausgabe in Text

vor 3 Monaten

0584

TwinMind: kostenlose Offline-Sprach-zu-Text-Transkriptions-App

综合介绍 TwinMind 是由 ThirdEar AI, Inc. 开发的一款智能工具，主打“帮你记住一切”。它能把对话、会议或讲座实时录下来并转成文字，支持 100 多种语言，哪怕手机放口袋里也能...

Neueste AI-Tools # KI-Tool zur Zusammenfassung von Text und Audio/Video # AI Sprachausgabe in Text

vor 3 Monaten

0576

Wispr Flow: Verwenden Sie Ihre Stimme zur schnellen Texteingabe in jeder Anwendung

综合介绍 Wispr Flow 是一个通过语音输入文字的工具，帮助用户在电脑上快速写作。它主打“3倍于打字速度”的体验，用户只需自然说话，就能将文字输入到任何应用中，比如 Word、Slack 或 G...

Neueste AI-Tools # AI Sprachausgabe in Text

vor 1 Monat

0723

Meeting: Lokale Echtzeit-Transkription und Erstellung von Meeting-Protokollen des Open-Source-Clients

综合介绍 Meeting Minutes（又名 Meetily）是由 Zackriya Solutions 开发的一款免费开源的 AI 会议助手工具，专注于实时捕获会议音频、生成转录文本并自动提取会议...

Neueste AI-Tools # AI Java Open Source Projekt # KI-Tool zur Zusammenfassung von Text und Audio/Video # AI Sprachausgabe in Text

vor 4 Monaten

0883

Local-NotebookLM: lokales PDF zur Erstellung von Sprachpodcasts von Open-Source-Tools

Umfassende Einführung Local-NotebookLM ist ein Open-Source-Projekt, das darauf abzielt, lokal ausgeführte intelligente Dokumentverarbeitungs- und Inhaltserstellungswerkzeuge bereitzustellen. Es ist inspiriert von Google NotebookLM und konzentriert sich auf die Unterstützung von Benutzern bei der Umwandlung von PDF- und anderen Dokumenten in eine Vielzahl von ...

Neueste AI-Tools # AI Java Open Source Projekt # AI Sprachausgabe in Text

vor 4 Monaten

0720

AssemblyAI: Hochpräzise Sprache-zu-Text- und Audio Intelligence-Analyseplattform

Allgemeine Einführung AssemblyAI ist eine Plattform, die sich auf Sprach-KI-Technologie konzentriert und Entwicklern und Unternehmen effiziente Sprache-zu-Text- und Audio-Analyse-Tools zur Verfügung stellt. Sein Kern Highlight ist die Universal-Familie von Modellen, insbesondere die neu veröffentlichte Universal-2...

Neueste AI-Tools # AI Offene Dienste # AI Sprachausgabe in Text

vor 4 Monaten

0766

FireRedASR: Ein Open-Source-Modell für mehrsprachige hochpräzise Spracherkennung

综合介绍 FireRedASR 是由小红书 FireRed 团队开发并开源的语音识别模型，专注于提供高精度、多语言支持的自动语音识别（ASR）解决方案。项目托管于 GitHub，面向开发者与研究者，提...

Neueste AI-Tools # AI Java Open Source Projekt # AI Sprachausgabe in Text

vor 4 Monaten

0827

WhisperChain: Sprache-zu-Text in Echtzeit und Optimierung von gesprochenen Wörtern

综合介绍 WhisperChain 是一个基于人工智能的开源项目，托管在 GitHub 上，由开发者 Chris Choy 主导开发。它主要用于将语音转化为文字，并通过 AI 技术自动优化表达，去除冗...

Neueste AI-Tools # AI Java Open Source Projekt # AI Sprachausgabe in Text

vor 5 Monaten

0759

LLPlayer: ein Videoplayer, der in Echtzeit Untertitel mit zweisprachiger Übersetzung erzeugt

综合介绍 LLPlayer 是一款专为语言学习者设计的开源媒体播放器，托管于 GitHub，由开发者 umlx5h 创建。它集成了多种实用功能，如双语字幕显示、AI 自动生成字幕、实时翻译和单词查询等...

Neueste AI-Tools # AI Java Open Source Projekt # AI Übersetzung # AI Sprachausgabe in Text

vor 1 Monat

01.2K

CapsWriter-Offline: Spracheingabe- und Untertitel-Transkriptionstool für den PC

Allgemeine Einführung CapsWriter-Offline ist ein Spracheingabe- und Untertitel-Transkriptionstool für PC, das auf GitHub gehostet und vom Entwickler HaujetZhao erstellt wurde. Es läuft komplett offline und benötigt keine Internetverbindung für Sprache-zu-Text und audiovisuelle...

Neueste AI-Tools # AI Java Open Source Projekt # AI Sprachausgabe in Text

vor 5 Monaten

0883

Mehr laden

AI Speech to Text