로드 중

Sharenet
  • AI 실습 튜토리얼
  • AI 유틸리티 명령
  • 코스 정보
  • AI 기술 자료
  • AI 답변
  • 기여하고 싶습니다.
    • 최고의 AI 추천
    • 최신 AI 도구
    • AI 기사 작성
    • AI 이미지 생성
    • AI 비디오 도구
    • AI 오피스 효율성
    • AI 프로그래밍 도구
    • AI 디자인 도구
    • AI 채팅 도우미
    • AI 인텔리전스

    视觉目标检测

    共 18 篇文章
    排序
    发布更新浏览点赞
    Trackers:用于视频对象跟踪的开源工具库

    Trackers:用于视频对象跟踪的开源工具库

    综合介绍 Trackers 是一个开源的 Python 工具库,专注于视频中的多对象跟踪。它集成了多种领先的跟踪算法,如 SORT 和 DeepSORT,允许用户结合不同的对象检测模型(如 YOLO...
    최신 AI 도구# AI开源项目# 视觉目标检测
    4周前
    02150
    Describe Anything:为图像和视频区域生成详细描述的开源工具

    Describe Anything:为图像和视频区域生成详细描述的开源工具

    综合介绍 Describe Anything 是由 NVIDIA 和多所大学联合开发的开源项目,核心是 Describe Anything Model(DAM)。这个工具能根据用户在图像或视频中标记的...
    최신 AI 도구# AI开源项目# 视觉目标检测
    4周前
    02020
    Find My Kids:通过人脸识别和WhatsApp通知的儿童安全监控工具

    Find My Kids:通过人脸识别和WhatsApp通知的儿童安全监控工具

    综合介绍 Find My Kids 是一个开源项目,托管在 GitHub 上,由开发者 Tomer Klein 创建。它结合了 DeepFace 人脸识别技术和 WhatsApp Green API...
    최신 AI 도구# AI开源项目# 视觉目标检测
    1个月前
    02220
    YOLOE:实时视频检测和分割物体的开源工具

    YOLOE:实时视频检测和分割物体的开源工具

    综合介绍 YOLOE 是清华大学软件学院多媒体智能组(THU-MIG)开发的一个开源项目,全称“You Only Look Once Eye”。它基于 PyTorch 框架,属于 YOLO 系列的扩展...
    최신 AI 도구# AI开源项目# AI抠图改背景# 视觉目标检测
    2个月前
    04490
    SegAnyMo:从视频中自动分割任意运动物体的开源工具

    SegAnyMo:从视频中自动分割任意运动物体的开源工具

    综合介绍 SegAnyMo 是一个开源项目,由加州大学伯克利分校和北京大学的研究团队开发,包括 Nan Huang 等成员。这个工具专注于视频处理,能自动识别和分割视频中任意运动的物体,比如人、动物或...
    최신 AI 도구# AI开源项目# AI抠图改背景# 视觉目标检测
    2个月前
    04910
    RF-DETR:实时视觉对象检测开源模型

    RF-DETR:实时视觉对象检测开源模型

    综合介绍 RF-DETR 是 Roboflow 团队开发的一个开源对象检测模型。它基于 Transformer 架构,核心特点是实时高效。模型在微软 COCO 数据集上首次实现超过 60 AP 的实时...
    최신 AI 도구# AI开源项目# 视觉目标检测
    2个月前
    06550
    HumanOmni:分析人类视频情感和动作的多模态大模型

    HumanOmni:分析人类视频情感和动作的多模态大模型

    综合介绍 HumanOmni 是由 HumanMLLM 团队开发的一个开源多模态大模型,托管在 GitHub 上。它专注于分析人类视频,能同时处理画面和声音,帮助理解情感、动作和对话内容。项目用了 2...
    최신 AI 도구# AI开源项目# 视觉目标检测
    2个月前
    04540
    Vision Agent:解决多种视觉目标检测任务的视觉智能体

    Vision Agent:解决多种视觉目标检测任务的视觉智能体

    综合介绍 Vision Agent 是由 LandingAI(吴恩达团队) 开发的一个开源项目,托管在 GitHub 上,旨在帮助用户快速生成解决计算机视觉任务的代码。它利用先进的代理框架和多模态模型...
    최신 AI 도구# AI开源项目# 视觉目标检测
    3 개월 전
    05290
    MakeSense:免费使用的图像标注工具,提升计算机视觉项目效率

    MakeSense:免费使用的图像标注工具,提升计算机视觉项目效率

    综合介绍 Make Sense 是一个免费的在线图像标注工具,旨在帮助用户快速为计算机视觉项目准备数据集。它无需复杂安装,只需打开浏览器访问即可使用,支持多种操作系统,非常适合小型深度学习项目。用户可...
    최신 AI 도구# AI开源项目# 视觉目标检测
    3 개월 전
    06920
    YOLOv12:实时图像和视频目标检测的开源工具

    YOLOv12:实时图像和视频目标检测的开源工具

    综合介绍 YOLOv12 是由 GitHub 用户 sunsmarterjie 开发的一个开源项目,专注于实时目标检测技术。该项目基于 YOLO(You Only Look Once)系列框架,引入注...
    최신 AI 도구# AI开源项目# 视觉目标检测
    3 개월 전
    09450
    VLM-R1:通过自然语言定位图像目标的视觉语言模型

    VLM-R1:通过自然语言定位图像目标的视觉语言模型

    综合介绍 VLM-R1 是由 Om AI Lab 开发的一个开源视觉语言模型项目,托管在 GitHub 上。该项目基于 DeepSeek 的 R1 方法,结合 Qwen2.5-VL 模型,通过强化学习...
    최신 AI 도구# AI开源项目# 视觉目标检测
    3 개월 전
    07860
    HealthGPT:支持医学图像分析与诊断问答的医疗大模型

    HealthGPT:支持医学图像分析与诊断问答的医疗大模型

    综合介绍 HealthGPT 是一个先进的医疗大视觉语言模型,旨在通过异构知识适应实现统一的医学视觉理解和生成功能。该项目的目标是将医学视觉理解和生成能力集成到一个统一的自回归框架中,显著提升了医疗图...
    최신 AI 도구# AI开源项目# 视觉目标检测
    3 개월 전
    06330
    MedRAX: 利用多模态大模型进行胸部X光片分析的智能体

    MedRAX: 利用多模态大模型进行胸部X光片分析的智能体

    综合介绍 MedRAX是一个专为胸部X光片(CXR)分析设计的先进AI智能体。它集成了最先进的CXR分析工具和多模态大语言模型,能够动态处理复杂的医学查询,而无需额外训练。MedRAX通过其模块化设计...
    최신 AI 도구# AI开源项目# 智能体应用# 视觉目标检测
    3 개월 전
    07840
    Agentic Object Detection:无需标注和训练的视觉目标检测工具

    Agentic Object Detection:无需标注和训练的视觉目标检测工具

    综合介绍 Agentic Object Detection 是由 Landing AI 推出的先进目标检测工具。该工具通过文本提示进行检测,无需进行数据标注和模型训练,极大地简化了传统目标检测的流程...
    최신 AI 도구# 视觉目标检测
    4개월 전
    07560
    CogVLM2:开源多模态模型,支持视频理解与多轮对话

    CogVLM2:开源多模态模型,支持视频理解与多轮对话

    综合介绍 CogVLM2 是由清华大学数据挖掘研究组(THUDM)开发的开源多模态模型,基于 Llama3-8B 架构,旨在提供与 GPT-4V 相当甚至更优的性能。该模型支持图像理解、多轮对话以及视...
    최신 AI 도구# AI开源项目# 视觉目标检测
    4개월 전
    07000
    Gaze-LLE: 视频中人物注视目标预测工具

    Gaze-LLE: 视频中人物注视目标预测工具

    综合介绍 Gaze-LLE是一款基于大规模学习编码器的注视目标预测工具。该项目由Fiona Ryan、Ajay Bati、Sangmin Lee、Daniel Bolya、Judy Hoffman和J...
    최신 AI 도구# AI开源项目# 视觉目标检测
    2个月前
    09230
    视频分析工具(Video Analyzer):分析视频内容并生成详细描述

    视频分析工具(Video Analyzer):分析视频内容并生成详细描述

    综合介绍 视频分析工具(Video Analyzer)是一个综合性的视频分析工具,结合了计算机视觉、音频转录和自然语言处理技术,能够生成详细的视频内容描述。该工具通过提取视频中的关键帧,转录音频内容...
    최신 AI 도구# AI开源项目# 视觉目标检测
    4개월 전
    01.3K0
    Twelve Labs:理解视频内容的多模态AI解决方案,视频搜索、生成、嵌入API服务

    Twelve Labs:理解视频内容的多模态AI解决方案,视频搜索、生成、嵌入API服务

    综合介绍 Twelve Labs是一家专注于视频理解的多模态AI公司,致力于通过先进的AI技术帮助用户理解和处理大量视频内容。其核心技术包括视频搜索、生成和嵌入,能够从视频中提取关键特征,如动作、对象...
    최신 AI 도구# AI开放服务# 视觉目标检测
    4개월 전
    08570
    没有了
    Sharenet
    Sharenet.ai, 가장 포괄적인 AI 학습 가이드 및 도구 탐색. 인공지능의 물결을 함께 맞이하세요! 브라우저 북마크 바에 이 사이트 북마크 추가 ❤️

    친숙한 링크 애플리케이션책임을 부인하거나 제한하는 진술광고 협력회사 소개

    저작권 © 2025 Sharenet 
    ko_KR한국어
    ko_KR한국어zh_CN简体中文 en_USEnglish ja日本語 es_ESEspañol de_DEDeutsch fr_FRFrançais pt_BRPortuguês do Brasil
    글쓰기
    글쓰기웹 주소하드웨어책