Trackers: ビデオオブジェクト追跡のためのオープンソースツールライブラリ一般的な紹介 Trackersは、映像内の複数オブジェクトのトラッキングに特化したオープンソースのPythonツールライブラリです。SORTやDeepSORTのようないくつかの主要なトラッキングアルゴリズムを統合しており、ユーザーは異なるオブジェクト検出モデル(YOLO...最新のAIツール# AI Java オープンソースプロジェクト# 視覚ターゲット検出4週間前02150
Describe Anything: 画像やビデオ領域の詳細な説明を生成するオープンソースツール一般的な説明 Describe AnythingはNVIDIAといくつかの大学によって開発されたオープンソースプロジェクトで、Describe Anything Model (DAM)を中核としています。このツールは、ユーザーの...最新のAIツール# AI Java オープンソースプロジェクト# 視覚ターゲット検出4週間前02030
Find My Kids:顔認証とWhatsApp通知による子供の安全監視ツール概要 Find My KidsはGitHubでホストされているオープンソースプロジェクトで、開発者のTomer Kleinによって作成された。このプロジェクトはDeepFace顔認識技術とWhatsApp Green APIを組み合わせています。最新のAIツール# AI Java オープンソースプロジェクト# 視覚ターゲット検出1ヶ月前02240
Gaze-LLE:映像中の人物注視のターゲット予測ツール综合介绍 Gaze-LLE是一款基于大规模学习编码器的注视目标预测工具。该项目由Fiona Ryan、Ajay Bati、Sangmin Lee、Daniel Bolya、Judy Hoffman和J...最新のAIツール# AI Java オープンソースプロジェクト# 視覚ターゲット検出2ヶ月前09280
YOLOE: リアルタイムのビデオ検出と物体分割のためのオープンソースツール综合介绍 YOLOE 是清华大学软件学院多媒体智能组(THU-MIG)开发的一个开源项目,全称“You Only Look Once Eye”。它基于 PyTorch 框架,属于 YOLO 系列的扩展...最新のAIツール# AI Java オープンソースプロジェクト# AIキーイングによる背景変更# 視覚ターゲット検出2ヶ月前04500
SegAnyMo: ビデオから任意の移動物体を自動的にセグメント化するオープンソースツール综合介绍 SegAnyMo 是一个开源项目,由加州大学伯克利分校和北京大学的研究团队开发,包括 Nan Huang 等成员。这个工具专注于视频处理,能自动识别和分割视频中任意运动的物体,比如人、动物或...最新のAIツール# AI Java オープンソースプロジェクト# AIキーイングによる背景変更# 視覚ターゲット検出2ヶ月前04930
RF-DETR:リアルタイム視覚物体検出のためのオープンソースモデル综合介绍 RF-DETR 是 Roboflow 团队开发的一个开源对象检测模型。它基于 Transformer 架构,核心特点是实时高效。模型在微软 COCO 数据集上首次实现超过 60 AP 的实时...最新のAIツール# AI Java オープンソースプロジェクト# 視覚ターゲット検出2ヶ月前06570
HumanOmni:人間のビデオ感情や行動を分析するためのマルチモーダル・マクロモデル综合介绍 HumanOmni 是由 HumanMLLM 团队开发的一个开源多模态大模型,托管在 GitHub 上。它专注于分析人类视频,能同时处理画面和声音,帮助理解情感、动作和对话内容。项目用了 2...最新のAIツール# AI Java オープンソースプロジェクト# 視覚ターゲット検出2ヶ月前04620
MedRAX:マルチモーダル・マクロモデルを用いた胸部X線写真解析のためのインテリジェントボディ包括的な紹介 MedRAXは、胸部X線(CXR)解析用に設計された最先端のAIインテリジェンスです。最先端のCXR解析ツールとマルチモーダル大規模言語モデルを統合し、追加トレーニングなしで複雑な医療クエリを動的に処理します。最新のAIツール# AI Java オープンソースプロジェクト#インテリジェント・ボディ・アプリケーション# 視覚ターゲット検出3ヶ月前07890
視覚エージェント:複数の視覚的ターゲット検出タスクを解決する視覚インテリジェンス综合介绍 Vision Agent 是由 LandingAI(吴恩达团队) 开发的一个开源项目,托管在 GitHub 上,旨在帮助用户快速生成解决计算机视觉任务的代码。它利用先进的代理框架和多模态模型...最新のAIツール# AI Java オープンソースプロジェクト# 視覚ターゲット検出3ヶ月前05360
MakeSense:コンピュータビジョンプロジェクトの効率を高める、無料で使える画像注釈ツール综合介绍 Make Sense 是一个免费的在线图像标注工具,旨在帮助用户快速为计算机视觉项目准备数据集。它无需复杂安装,只需打开浏览器访问即可使用,支持多种操作系统,非常适合小型深度学习项目。用户可...最新のAIツール# AI Java オープンソースプロジェクト# 視覚ターゲット検出3ヶ月前06980
YOLOv12:リアルタイム画像・ビデオターゲット検出のためのオープンソースツール综合介绍 YOLOv12 是由 GitHub 用户 sunsmarterjie 开发的一个开源项目,专注于实时目标检测技术。该项目基于 YOLO(You Only Look Once)系列框架,引入注...最新のAIツール# AI Java オープンソースプロジェクト# 視覚ターゲット検出3ヶ月前09510
VLM-R1:自然言語による画像ターゲットの位置決定のための視覚言語モデル综合介绍 VLM-R1 是由 Om AI Lab 开发的一个开源视觉语言模型项目,托管在 GitHub 上。该项目基于 DeepSeek 的 R1 方法,结合 Qwen2.5-VL 模型,通过强化学习...最新のAIツール# AI Java オープンソースプロジェクト# 視覚ターゲット検出3ヶ月前07880
HealthGPT:医療画像解析と診断Q&Aを支援する医療ビッグモデル综合介绍 HealthGPT 是一个先进的医疗大视觉语言模型,旨在通过异构知识适应实现统一的医学视觉理解和生成功能。该项目的目标是将医学视觉理解和生成能力集成到一个统一的自回归框架中,显著提升了医疗图...最新のAIツール# AI Java オープンソースプロジェクト# 視覚ターゲット検出3ヶ月前06360
エージェントによる物体検出:注釈やトレーニングを必要としない視覚的物体検出ツール综合介绍 Agentic Object Detection 是由 Landing AI 推出的先进目标检测工具。该工具通过文本提示进行检测,无需进行数据标注和模型训练,极大地简化了传统目标检测的流程...最新のAIツール# 視覚ターゲット検出4ヶ月前07600
Twelve Labs: 動画コンテンツの理解、動画検索、生成、APIサービスの組み込みのためのマルチモーダルAIソリューション综合介绍 Twelve Labs是一家专注于视频理解的多模态AI公司,致力于通过先进的AI技术帮助用户理解和处理大量视频内容。其核心技术包括视频搜索、生成和嵌入,能够从视频中提取关键特征,如动作、对象...最新のAIツール# AIオープンサービス# 視覚ターゲット検出4ヶ月前08640
ビデオアナライザー:ビデオコンテンツを分析し、詳細な説明を生成します。综合介绍 视频分析工具(Video Analyzer)是一个综合性的视频分析工具,结合了计算机视觉、音频转录和自然语言处理技术,能够生成详细的视频内容描述。该工具通过提取视频中的关键帧,转录音频内容...最新のAIツール# AI Java オープンソースプロジェクト# 視覚ターゲット検出4ヶ月前01.3K0
CogVLM2: 映像理解と複数回の対話を支援するオープンソースのマルチモーダルモデル综合介绍 CogVLM2 是由清华大学数据挖掘研究组(THUDM)开发的开源多模态模型,基于 Llama3-8B 架构,旨在提供与 GPT-4V 相当甚至更优的性能。该模型支持图像理解、多轮对话以及视...最新のAIツール# AI Java オープンソースプロジェクト# 視覚ターゲット検出4ヶ月前07030