Ultravox:实时端到端语音对话的音频多模态大模型,GPT-4o语音交互的开源实现

Ultravox: リアルタイムのエンドツーエンド音声対話のための音声マルチモーダル・マクロモデル、GPT-4o音声対話のオープンソース実装

综合介绍 Ultravox是一个创新的多模态大语言模型(LLM),专为实时语音处理而设计。与传统的语音识别系统不同,Ultravox无需单独的音频语音识别(ASR)阶段,能够直接将音频转换为高维空间中...
6ヶ月前
01.2K0
万知:办公场景个人AI工作站|聊天|文档阅读|写PPT

Wanchi: オフィスシーンで活躍するパーソナルAIワークステーション|チャット|文書閲覧|PPTライティング

综合介绍 万知网站提供一站式的AI文档阅读、内容创建以及分享平台。它为用户呈现了一个全功能的个人AI工作站,支持一键式聊天、文档分析、AI 内容创作和使用各种模板创建演示文稿。用户可以通过站点的工具...
9ヶ月前
01.2K0
紫东太初:多模态大模型平台,支持文本创作、图像生成、3D理解、信号分析等任务

Zidong Taichu:テキスト作成、画像生成、3D理解、信号解析などのタスクをサポートするマルチモーダル大規模モデルプラットフォーム

包括的な紹介 Zidong Taichuは、中国科学院自動化研究所と武漢人工知能研究所によって立ち上げられた新世代のマルチモーダルビッグモデルプラットフォームである。このプラットフォームは、マルチラウンド質疑応答、テキスト作成、画像生成、3D理解、信号分析などの複数のタスクをサポートし、強力な認識、理解、創造能力を備えている。Zidong ...
8ヶ月前
01.1K0
Ai2 OLMoE:基于 OLMoE 模型离线运行的开源iOS AI应用

Ai2 OLMoE:オフラインで動作するOLMoEモデルに基づくオープンソースのiOS AIアプリ

概要 Ai2 OLMoEは、Allen Institute for AI (Ai2, Allen Institute for Artificial Intelligence)によって開発されたオープンソースのiOSアプリで、デバイス上で動作するAIモデルを提供します。このアプリは、Ai2のオープンソースOLMoEを活用しています。
4ヶ月前
07020