Unsloth:高效微调和训练大语言模型的开源工具

Unsloth: una herramienta de código abierto para ajustar y entrenar modelos lingüísticos de gran tamaño

Introducción Unsloth es un proyecto de código abierto diseñado para proporcionar herramientas eficientes para el ajuste fino y la formación de grandes modelos lingüísticos (LLM). El proyecto soporta una variedad de modelos bien conocidos, incluyendo Llama, Mistral, Phi, y Gemma.Unsloth...
hace 4 meses
01.1K
OpenAI Realtime Agents:多智能体语音交互应用(OpenAI示例)

Agentes en tiempo real de OpenAI: una aplicación multiinteligente de interacción cuerpo-voz (ejemplo de OpenAI)

Introducción General OpenAI Realtime Agents es un proyecto de código abierto que tiene como objetivo mostrar cómo la API en tiempo real de OpenAI se puede utilizar para construir aplicaciones de voz corporal multi-inteligente. Proporciona un modelo de cuerpo inteligente de alto nivel (tomado de OpenAI Swarm) que permite...
hace 5 meses
01.1K
SynthLight:对肖像图像进行自然光照渲染(未发布)

SynthLight: reproducción de imágenes de retratos con luz natural (inédito)

Descripción general SynthLight es una herramienta de reiluminación de retratos basada en un modelo de difusión. Aprende a volver a renderizar imágenes faciales sintéticas para conseguir ajustes de efectos de iluminación en fotos de retratos reales. La herramienta utiliza un motor de renderizado físico para generar conjuntos de datos que simulan transformaciones de la iluminación en diferentes condiciones de luz...
hace 5 meses
01.1K
Charla:基于终端的极简AI聊天工具,本地集成Ollama后端

Charla: una herramienta de chat AI minimalista basada en endpoints con integración nativa en el backend de Ollama.

Descripción general Charla es una aplicación de chat basada en endpoints diseñada para entablar diálogos con modelos lingüísticos nativos. La aplicación se integra con el backend Ollama, admite diálogos contextuales y guarda las sesiones de chat como archivos Markdown. Los usuarios pueden...
hace 5 meses
01.2K
百聆 (Bailing):低延时的开源语音对话助手,轻松实现自然对话交流

Bailing: un asistente de diálogo de voz de código abierto y baja latencia para la conversación y la comunicación naturales

Introducción Bailing (Bailing) es un asistente de diálogo por voz de código abierto diseñado para entablar un diálogo natural con los usuarios a través del habla. El proyecto combina tecnologías de reconocimiento del habla (ASR), detección de la actividad de la voz (VAD), modelado amplio del lenguaje (LLM) y síntesis del habla (TTS) para lograr...
hace 5 meses
01.1K