Midjourney V7 Alpha Test se lanza con el nuevo "Modo Borrador"
人工智能图像生成领域的热门工具 Midjourney 近日发布了其最新模型 Midjourney V7 的 Alpha 测试版本。此次更新距离上一个主要版本 V6 发布已近一年,带来了多项重要改进和新...
GitHub Copilot 调整策略:引入高级模型使用限制与新付费方案
近期,隶属于微软的 GitHub 对其广受欢迎的 AI 编程助手 GitHub Copilot 的服务策略进行了调整,引入了新的使用限制,并针对部分高级 AI 模型功能推出了收费机制。这一变化可能意味...
Augment Code: un asistente de AI para grandes bases de código
Introducción general Augment Code es una herramienta de codificación AI diseñada para ingenieros de software profesionales, con una característica central de comprensión profunda de su base de código. Ocupa el primer puesto en la comparativa SWE-Bench Verified con una puntuación de 65,4%, y combina Cla...
DeepSite: Genere páginas web front-end gratuitas con previsualizaciones en tiempo real mediante DeepSeek V3
Introducción general DeepSite es una herramienta de generación de sitios web basada en IA que permite a los usuarios generar rápidamente una página web front-end ejecutable en vivo introduciendo una simple descripción de texto. Desarrollada por enzostvs, miembro de la comunidad Hugging Face,...
Conversión de vídeo y voz a subtítulos SRT mediante el modelo Gimine 2.5 Pro
Ya he intentado antes convertir voz a subtítulos para varios locutores con Gemini 2.0 gratis, y el resultado es bastante bueno. Lo he vuelto a intentar con Gimine 2.5 pro. En primer lugar, encontré una muestra de subtítulo SRT estándar como base de referencia (hacer el discurso...
uniOCR: herramienta de reconocimiento de texto multiplataforma y de código abierto
Introducción general uniOCR es una herramienta de reconocimiento de texto de código abierto desarrollada por el equipo mediar-ai. Está basada en el lenguaje Rust y es compatible con los sistemas macOS, Windows y Linux. Los usuarios pueden utilizarla para extraer texto de imágenes...
Serena: una herramienta MCP gratuita para la recuperación semántica y la edición de código
Introducción general Serena es una herramienta de programación gratuita y de código abierto desarrollada por el equipo Oraios AI y alojada en GitHub. Es un potente asistente de código que funciona directamente en su base de código para ayudar a los desarrolladores a analizar, editar y ejecutar código.Seren...
AudioX:参考文本、图像、视频生成音频和音乐
综合介绍 AudioX 是一个由 Zeyue Tian 等人在 GitHub 上开源的项目,官方论文发布于 arXiv(编号 2503.10522)。它基于扩散变换器(Diffusion Transf...
EasyControl: una herramienta gratuita para convertir retratos en imágenes al estilo Ghibli
Introducción general EasyControl es un proyecto de código abierto, el proyecto se basa en la arquitectura del transformador de difusión (DiT) para proporcionar un control eficiente y flexible de la generación de imágenes. Entre ellos , Ghibli Control LoRA es una de sus características especiales , mediante el uso de sólo 100 sub...
挑战奥赛级难题:7款主流LLM中文数学性能基准评测
数学能力,包含公式推导、逻辑链构建和抽象思维,长期以来被视为检验人工智能(AI),特别是大型语言模型(LLM)能力的关键领域。因为它不仅测试计算能力,更深入地考察了模型的推理、理解和解决复杂问题的能力...