Proyecto operativo de código abierto que integra múltiples servicios avanzados de síntesis de voz
Introducción general Open-VoiceCanvas es una plataforma de síntesis de voz de código abierto desarrollada por el equipo ItusiAI. Soporta más de 50 idiomas, y puede convertir texto en habla natural, así como clonar voces personalizadas subiendo audio. El proyecto integra Ope...
Libra: un cliente para generar inteligencias IA locales con diálogo (prueba interna)
Introducción general Libra es una innovadora herramienta de Greenbit.ai cuya función principal es generar inteligencias IA que se ejecutan localmente a través del diálogo en lenguaje natural. Denominada "Vibe Agent", permite a los usuarios describir sus necesidades en términos sencillos y crear rápidamente...
VideoMind: proyecto de código abierto de posicionamiento de vídeos por marcas de tiempo y preguntas y respuestas
Introducción general VideoMind es una herramienta de IA multimodal de código abierto centrada en la inferencia, las preguntas y respuestas y la generación de resúmenes para vídeos largos. Fue desarrollada por Ye Liu, de la Universidad Politécnica de Hong Kong, y un equipo del Show Lab de la Universidad Nacional de Singapur. La herramienta imita la comprensión humana del vídeo...
SuperCoder: Asistente de código inteligente para la ejecución de terminales de línea de comandos
Introducción general SuperCoder es una herramienta inteligente que se ejecuta en el terminal y está diseñada para programadores. Utiliza tecnología de IA para ayudar a los usuarios a buscar código, ver la estructura del proyecto, editar archivos y corregir errores.El proyecto es de código abierto por huytd en GitHub y soporta...
Emigo: un asistente para tareas complejas de programación que utiliza IA en Emacs
Introducción general Emigo es un asistente de programación de IA de código abierto diseñado para Emacs, desarrollado por MatthewZMD en GitHub. Ayuda a los programadores a completar el análisis de código en Emacs integrando un modelo de lenguaje a gran escala (LLM)....
SegAnyMo: herramienta de código abierto para segmentar automáticamente objetos arbitrarios en movimiento a partir de vídeo
Introducción general SegAnyMo es un proyecto de código abierto desarrollado por un equipo de investigadores de la UC Berkeley y la Universidad de Pekín, entre los que se encuentran miembros como Nan Huang. Esta herramienta se centra en el procesamiento de vídeo y puede identificar y segmentar automáticamente objetos arbitrarios en movimiento en un vídeo, como personas, animales o...
ChatGPT生成肖像双重风格对比提示词
提示词 A dramatic, front-facing close-up portrait of Hayao Miyazaki. The composition is perfectly symme...
当Gemini 2.5遇见Three.js,彻底解决教学演示动画制作
Three.js 就是一个让网页能显示“立体”图像的工具。你可以把它想象成: 它提供了一套工具,让开发者可以在网页上画出各种 3D 的形状,比如立方体、球体等等。 它还能让这些 3D 形状动起来,实现...
GeminiCode: un asistente de programación basado en Gemini 2.5 que funciona en terminales
综合介绍 GeminiCode 是一个在终端中运行的 AI 编程助手,由开发者在周末业余时间开发。它基于 Google 的 Gemini 2.5 Pro 模型,能读取和修改你电脑当前目录中的文件。这个...
GenXD:生成任意3D和4D场景视频的开源框架
综合介绍 GenXD 是一个开源项目,由新加坡国立大学(NUS)和微软团队开发。它专注于生成任意 3D 和 4D 场景,解决真实世界中 3D 和 4D 生成因数据不足和模型设计复杂带来的难题。项目通过...