Vision is All You Need:使用视觉语言模型构建智能文档检索系统(Vision RAG)

Vision is All You Need: Building an Intelligent Document Retrieval System Using Visual Language Models (Visión RAG)

综合介绍 Vision-is-all-you-need 是一个创新的视觉RAG(检索增强生成)系统演示项目,它突破性地将视觉语言模型(VLM)应用于文档处理领域。不同于传统的文本分块方法,该系统直接使...
hace 5 meses
0985
AI Web Operator:浏览器自动化操作,OpenAI Operator的开源实现

AI Web Operator: Automatización de navegadores, implementación de código abierto de OpenAI Operator

Introducción general AI Web Operator es una herramienta de código abierto AI navegador operador diseñado para simplificar la experiencia del usuario en el navegador mediante la integración de múltiples tecnologías de IA y SDKs. La herramienta se basa en Browserbase y Vercel....
hace 5 meses
0984
Memora:构建人性化AI记忆模块,保存并更新与人类的互动信息

Memora: construcción de módulos de memoria de IA humanizada para guardar y actualizar información sobre interacciones con humanos.

综合介绍 Memora是一个旨在为每个个性化AI复制人类记忆的代理。它通过时间戳记忆、情感标记和多模态记忆等功能,帮助AI像人类一样记住过去的互动细节、情感和共享经历。Memora支持多租户,能够处理...
hace 5 meses
0982
口袋AI:手机中运行的离线AI助手,适配 DeepSeek-R1 (5.37GB)

Pocket AI: un asistente de inteligencia artificial offline que se ejecuta en el teléfono, adaptado para DeepSeek-R1 (5,37 GB)

Introducción general Pocket AI (PocketPal AI versión china) es un potente asistente de IA offline diseñado para permitir a los usuarios hablar con la IA en cualquier momento y lugar. Se basa en Small Language Models (SLMs) y funciona en teléfonos móviles sin conexión a Internet, especialmente adaptado a la experiencia del usuario chino. Boca...
hace 4 meses
0979