视觉目标检测

ordenar

Correo electrónico:actualización hojear felicitaciones

Trackers: biblioteca de herramientas de código abierto para el seguimiento de objetos en vídeo

综合介绍 Trackers 是一个开源的 Python 工具库，专注于视频中的多对象跟踪。它集成了多种领先的跟踪算法，如 SORT 和 DeepSORT，允许用户结合不同的对象检测模型（如 YOLO...

Últimas herramientas de IA # AI Java Proyecto de código abierto # Detección visual de objetivos

hace 2 meses

0520

Describe Anything: herramienta de código abierto para generar descripciones detalladas de imágenes y zonas de vídeo.

综合介绍 Describe Anything 是由 NVIDIA 和多所大学联合开发的开源项目，核心是 Describe Anything Model（DAM）。这个工具能根据用户在图像或视频中标记的...

Últimas herramientas de IA # AI Java Proyecto de código abierto # Detección visual de objetivos

hace 2 meses

0471

Find My Kids: herramienta de vigilancia de la seguridad infantil mediante reconocimiento facial y notificaciones de WhatsApp

综合介绍 Find My Kids 是一个开源项目，托管在 GitHub 上，由开发者 Tomer Klein 创建。它结合了 DeepFace 人脸识别技术和 WhatsApp Green API...

Últimas herramientas de IA # AI Java Proyecto de código abierto # Detección visual de objetivos

hace 3 meses

0451

YOLOE: una herramienta de código abierto para la detección de vídeo en tiempo real y la segmentación de objetos

YOLOE es un proyecto de código abierto desarrollado por el Grupo de Inteligencia Multimedia (THU-MIG) de la Escuela de Software de la Universidad de Tsinghua, cuyo nombre completo es "You Only Look Once Eye". Está basado en el framework PyTorch , pertenece a la serie de extensiones YOLO ...

Últimas herramientas de IA # AI Java Proyecto de código abierto # Teclado AI para cambiar fondos # Detección visual de objetivos

hace 4 meses

0718

SegAnyMo: herramienta de código abierto para segmentar automáticamente objetos arbitrarios en movimiento a partir de vídeo

Introducción general SegAnyMo es un proyecto de código abierto desarrollado por un equipo de investigadores de la UC Berkeley y la Universidad de Pekín, entre los que se encuentran miembros como Nan Huang. Esta herramienta se centra en el procesamiento de vídeo y puede identificar y segmentar automáticamente objetos arbitrarios en movimiento en un vídeo, como personas, animales o...

Últimas herramientas de IA # AI Java Proyecto de código abierto # Teclado AI para cambiar fondos # Detección visual de objetivos

hace 4 meses

0730

RF-DETR：实时视觉对象检测开源模型

综合介绍 RF-DETR 是 Roboflow 团队开发的一个开源对象检测模型。它基于 Transformer 架构，核心特点是实时高效。模型在微软 COCO 数据集上首次实现超过 60 AP 的实时...

Últimas herramientas de IA # AI Java Proyecto de código abierto # Detección visual de objetivos

hace 4 meses

0879

HumanOmni：分析人类视频情感和动作的多模态大模型

综合介绍 HumanOmni 是由 HumanMLLM 团队开发的一个开源多模态大模型，托管在 GitHub 上。它专注于分析人类视频，能同时处理画面和声音，帮助理解情感、动作和对话内容。项目用了 2...

Últimas herramientas de IA # AI Java Proyecto de código abierto # Detección visual de objetivos

hace 4 meses

0710

Vision Agent: una inteligencia visual para resolver múltiples tareas de detección visual de objetivos

综合介绍 Vision Agent 是由 LandingAI（吴恩达团队）开发的一个开源项目，托管在 GitHub 上，旨在帮助用户快速生成解决计算机视觉任务的代码。它利用先进的代理框架和多模态模型...

Últimas herramientas de IA # AI Java Proyecto de código abierto # Detección visual de objetivos

hace 5 meses

0802

MakeSense: una herramienta gratuita de anotación de imágenes para aumentar la eficacia de los proyectos de visión por ordenador

Introducción general Make Sense es una herramienta gratuita de anotación de imágenes en línea diseñada para ayudar a los usuarios a preparar rápidamente conjuntos de datos para proyectos de visión por ordenador. No requiere ninguna instalación complicada, basta con abrir un navegador de acceso para utilizarlo, soporta múltiples sistemas operativos, y es ideal para pequeños proyectos de aprendizaje profundo. Los usuarios pueden...

Últimas herramientas de IA # AI Java Proyecto de código abierto # Detección visual de objetivos

hace 5 meses

0969

YOLOv12: una herramienta de código abierto para la detección de objetivos de imagen y vídeo en tiempo real

Introducción completa YOLOv12 es un proyecto de código abierto desarrollado por el usuario de GitHub sunsmarterjie , centrándose en la tecnología de detección de objetivos en tiempo real . El proyecto se basa en YOLO (You Only Look Once) serie de marcos , la introducción de nota ...

Últimas herramientas de IA # AI Java Proyecto de código abierto # Detección visual de objetivos

hace 5 meses

01.2K

VLM-R1：通过自然语言定位图像目标的视觉语言模型

综合介绍 VLM-R1 是由 Om AI Lab 开发的一个开源视觉语言模型项目，托管在 GitHub 上。该项目基于 DeepSeek 的 R1 方法，结合 Qwen2.5-VL 模型，通过强化学习...

Últimas herramientas de IA # AI Java Proyecto de código abierto # Detección visual de objetivos

hace 5 meses

01K

HealthGPT: un gran modelo médico de apoyo al análisis de imágenes médicas y a las preguntas y respuestas diagnósticas

综合介绍 HealthGPT 是一个先进的医疗大视觉语言模型，旨在通过异构知识适应实现统一的医学视觉理解和生成功能。该项目的目标是将医学视觉理解和生成能力集成到一个统一的自回归框架中，显著提升了医疗图...

Últimas herramientas de IA # AI Java Proyecto de código abierto # Detección visual de objetivos

hace 5 meses

0865

MedRAX: 利用多模态大模型进行胸部X光片分析的智能体

综合介绍 MedRAX是一个专为胸部X光片（CXR）分析设计的先进AI智能体。它集成了最先进的CXR分析工具和多模态大语言模型，能够动态处理复杂的医学查询，而无需额外训练。MedRAX通过其模块化设计...

Últimas herramientas de IA # AI Java Proyecto de código abierto # Aplicación de carrocería inteligente # Detección visual de objetivos

hace 4 meses

01K

Agentic Object Detection：无需标注和训练的视觉目标检测工具

综合介绍 Agentic Object Detection 是由 Landing AI 推出的先进目标检测工具。该工具通过文本提示进行检测，无需进行数据标注和模型训练，极大地简化了传统目标检测的流程...

Últimas herramientas de IA # Detección visual de objetivos

hace 5 meses

01K

CogVLM2：开源多模态模型，支持视频理解与多轮对话

综合介绍 CogVLM2 是由清华大学数据挖掘研究组（THUDM）开发的开源多模态模型，基于 Llama3-8B 架构，旨在提供与 GPT-4V 相当甚至更优的性能。该模型支持图像理解、多轮对话以及视...

Últimas herramientas de IA # AI Java Proyecto de código abierto # Detección visual de objetivos

hace 5 meses

0910

Gaze-LLE: herramienta de predicción de la mirada de una persona en vídeo

Synthesis Gaze-LLE es una herramienta de predicción del objetivo de la mirada basada en un codificador de aprendizaje a gran escala. Fue desarrollada por Fiona Ryan, Ajay Bati, Sangmin Lee, Daniel Bolya, Judy Hoffman y J...

Últimas herramientas de IA # AI Java Proyecto de código abierto # Detección visual de objetivos

hace 3 meses

01.1K