Step-Audio:多模态语音交互框架,识别语音并使用克隆语音交流等功能

Step-Audio: un marco de interacción multimodal por voz que reconoce el habla y se comunica mediante habla clonada, entre otras funciones.

Introducción completa Step-Audio es un marco de interacción del habla inteligente de código abierto diseñado para proporcionar capacidades de comprensión y generación del habla listas para usar en entornos de producción. El marco admite conversaciones en varios idiomas (por ejemplo, chino, inglés, japonés), habla emocional (por ejemplo, feliz, triste), dialectos regionales (por ejemplo, cantonés, szechuan ...
hace 4 meses
0942
Watermark Removal:开源去除图像水印工具,图片去水印恢复原始图像

Eliminación de marca de agua:open source image watermark removal tool, picture watermark recovery original image

Introducción general Watermark Removal es un proyecto de código abierto que utiliza técnicas de aprendizaje automático y aprendizaje profundo para la restauración de imágenes, concretamente para eliminar marcas de agua de imágenes. El proyecto fue desarrollado por Chimzuruoke Okafor y se inspira en Con...
hace 4 meses
0779
免费在线数字人生成工具,支持声音、数字分身克隆和视频去水印

Herramienta gratuita de generación de personas digitales en línea con soporte para sonido, clonación de divisiones digitales y eliminación de marcas de agua en vídeo.

综合介绍 数字人生成系统是一个提供免费数字人生成服务的网站。该网站支持声音克隆、声音复刻、数字人形象模板、数字分身克隆、视频去水印等功能,旨在为用户提供高效、便捷的数字人生成解决方案。用户可以通过上传...
7天前
0806
Confident AI:自动化大语言模型评估框架,对比不同大模型提示词输出质量

Confident AI: a framework for automated large language model evaluation, comparing the quality of output of different large model cue words (en inglés)

Introducción completa DeepEval es un marco de evaluación LLM de código abierto fácil de usar para evaluar y probar grandes sistemas de modelado del lenguaje. Es similar a Pytest, pero se centra en las pruebas unitarias de los resultados LLM. DeepEval combina los últimos resultados de la investigación...
hace 4 meses
0729
Quadratic:集成AI对话和代码执行的在线数据分析表格

Quadratic: formularios de análisis de datos en línea que integran el diálogo con la IA y la ejecución de código

Descripción general Quadratic es una herramienta de hoja de cálculo inteligente de código abierto que combina características de IA, código y conectividad de datos diseñadas para proporcionar a los usuarios potentes capacidades de procesamiento y análisis de datos. Al soportar lenguajes de programación como Python, SQL y Rust, Quadratic...
hace 4 meses
0608
SVLS:SadTalker增强版,使用人像视频生成数字人

SVLS: SadTalker mejorado para generar personas digitales utilizando vídeo de retratos

Descripción general SadTalker-Video-Lip-Sync es una herramienta de síntesis labial de vídeo basada en la implementación de SadTalkers. El proyecto genera formas labiales a través de la generación por voz y utiliza la mejora configurable de la región facial para mejorar la claridad de las formas labiales generadas....
hace 4 meses
0719
Tifa-DeepsexV2-7b-MGRPO:支持角色扮演和复杂对话的模型,性能超越32b(附一键安装包)

Tifa-DeepsexV2-7b-MGRPO: un modelo que admite juegos de rol y diálogos complejos, con un rendimiento superior a 32b (con instalador de un solo clic).

Introducción exhaustiva Tifa-DeepsexV2-7b-MGRPO-GGUF-Q4 es un eficiente modelo de lenguaje diseñado para soportar juegos de rol complejos y diálogos de varias rondas. Profundamente optimizado sobre la base de Qwen 2.5-7B, cuenta con una excelente generación de texto y diálogo....
hace 4 meses
01.1K
mac assistant:macOS设备自动执行桌面操作的AI智能体

mac assistant: la inteligencia artificial que automatiza las acciones del escritorio en dispositivos macOS

Introducción general mac assistant es un proyecto de cuerpo de inteligencia AI diseñado para macOS, con el objetivo de simplificar las operaciones del usuario mediante la combinación de software nativo y funciones web. Actualmente, el proyecto es compatible con las API OpenAI y GEMINI, y tiene previsto ...
hace 4 meses
0655