RF-DETR:实时视觉对象检测开源模型

RF-DETR:リアルタイム視覚物体検出のためのオープンソースモデル

包括的な紹介 RF-DETRはRoboflowチームによって開発されたオープンソースの物体検出モデルです。RF-DETRはTransformerアーキテクチャをベースにしており、リアルタイム性を特徴としています。このモデルはMicrosoft COCOデータセット上で初めて60APs以上のリアルタイム性を達成した。
3ヶ月前
07250
Aana SDK:简易部署多模态AI模型的开源工具

Aana SDK: マルチモーダルAIモデルを簡単に導入できるオープンソースツール

概論 Aana SDKはMobius Labsが開発したオープンソースのフレームワークで、マラヤーラム語のആന(象)にちなんで名付けられた。開発者がマルチモーダルAIモデルを迅速にデプロイ、管理できるように支援し、テキスト、画像、音声、動画、その他のデータの処理をサポートします。
3ヶ月前
05110
PiT:用图像零件拼出完整图像的工具(未开放)

PiT:画像パーツから完全な画像をつなぎ合わせるツール(未開封)

概論 PiT(Piece it Together)はGitHubでホストされているオープンソースツールで、テルアビブ大学のエラッド・リチャードソンなどの研究者によって開発された。羽のような断片化された画像パーツを入力することができる。
3ヶ月前
05770
Agent TARS:使用视觉和命令操作电脑的开源智能体

エージェントTARS:視覚とコマンドを使ってコンピュータを操作するオープンソースのインテリジェンス

综合介绍 Agent TARS 是一个由字节跳动开源的多模态 AI 智能体,核心特点是通过视觉理解网页内容,并结合命令行和文件系统操作,帮助用户完成复杂的电脑任务。它不像传统工具需要手动操作,而是能自...
3ヶ月前
06150
Qlib:微软开发的AI量化投资研究工具

Qlib:マイクロソフトが開発したAI定量投資調査ツール

Qlibはマイクロソフトが開発したオープンソースのプラットフォームであり、AI技術を活用してクオンツ投資のリサーチを支援することに主眼を置いている。Qlibは、最も基本的なデータ処理からスタートし、ユーザーが投資アイデアを探求し、使える戦略に変えることをサポートする。このプラットフォームはシンプルで使いやすく、機械学習を使って投資リサーチを改善したい人に適している。
3ヶ月前
05600
Fast.io:AI快速分析大规模企业数据并提供决策

Fast.io:AIが大規模な企業データを素早く分析し、意思決定を下す

概要 Fast.ioは、大規模なデータを実用的な洞察に変えることに集中するチームのためのAIワークベンチです。文書、画像、動画など数千のファイルを素早く分析し、要約を生成して質問に答える。このサイトは、MediaFireの創設者...
3ヶ月前
05190
自动爬取小说并生成多角色有声书的工具

小説を自動的にクロールし、多文字のオーディオブックを生成するツール

概論 Auto-Audio-BookはGitHubでホストされているオープンソースプロジェクトです。ウェブサイトから小説の内容を自動的にクロールし、複数のキャラクターの声を持つオーディオブックに変換します。開発者 zqq-nuli Python 3.1...
3ヶ月前
06030
Oliva:语音控制的多智能体产品搜索助手

Oliva:音声制御のマルチインテリジェンス製品検索アシスタント

概要 OlivaはDeluxerがGitHubで開発したオープンソースのマルチインテリジェンスアシスタントツールです。複数のAIインテリジェンスの連携により、Qdrantデータベースの商品情報検索を支援します。主な特徴は、音声操作に対応していることです...
3ヶ月前
05610
Playwright MCP:微软推出的浏览器自动化MCP服务

Playwright MCP:マイクロソフトのブラウザ自動化MCPサービス

一般的な紹介 Playwright MCPはMicrosoftによって開発され、GitHubでホストされているオープンソースツールである。モデルコンテキストプロトコル(MCP)プロトコルを介して、人工知能モデルがブラウザを直接制御できるようにする。
3ヶ月前
08950
InfiniteYou:保留人脸特征的照片生成与编辑工具

InfiniteYou:顔の特徴を保持する写真生成・編集ツール

概要 InfiniteYouは、ByteDance Intelligent Creationチームによって開発されたオープンソースプロジェクトです。拡散トランスフォーマー(DiTs)技術に基づき、FLUX.1-devモデルを使用しています。主な機能は、ユーザーが写真をアップロードし、テキストの説明を入力することで、写真を生成することです。
3ヶ月前
06860
Strella:用AI进行专业访谈和深度洞察的工具

Strella:プロフェッショナルなインタビューとAIによる深い洞察のためのツール

一般的な紹介 Strellaは、AIを使ってチームがプロフェッショナルなインタビューを行い、顧客の本音を素早く掘り起こすのを支援するオンラインツールです。AIを使って1対1のインタビューをシミュレートし、数時間で深い洞察を得ることができるため、従来の方法よりも時間と労力を節約することができます。
3ヶ月前
05750