AI开源项目 - 第23页

順番に並べる

AIBot PRO：複数のAI製品を統合した商品化アグリゲーション・プラットフォーム

総合紹介 AIBot PROは、複数のAI製品を統合するための便利なプラットフォームをユーザーに提供するために設計された、.NET 6ベースのAIアグリゲーションクライアントです。このクライアントは、無感覚な切り替え対話をサポートし、ChatGPT、Gemini、Claude、Wenxin Yiyin...を統合します。

4ヶ月前

07090

ColossalAI: 効率的な大規模AIモデル学習ソリューションの提供

包括的な紹介 ColossalAIは、HPC-AI Technologies社によって開発されたオープンソースのプラットフォームで、大規模なAIモデルの学習と推論に効率的でコスト効率の高いソリューションを提供します。複数の並列戦略、ヘテロジニアスメモリ管理、混合精度学習をサポートすることで、ColossalAIは...

4ヶ月前

06710

Minima: オープンソースのRAGコンテナで、ローカルへのデプロイやChatGPTへの統合が可能。

综合介绍 Minima 是一个开源的 RAG（Retrieval-Augmented Generation）解决方案，支持在本地部署和与 ChatGPT 集成。该项目由 dmayboroda 维护，旨...

4ヶ月前

01.1K0

HealthGPT：医療画像解析と診断Q&Aを支援する医療ビッグモデル

包括的な紹介 HealthGPTは、異種知識適応による統一的な医療視覚理解と生成能力の達成を目指す、先進的な医療グランドビジュアル言語モデルである。このプロジェクトの目標は、医療グラフを大幅に改善する統一的な自己回帰フレームワークに医療視覚理解と生成能力を統合することである。

4ヶ月前

07160

MatAnyone: ターゲットポートレート指定ビデオ抽出、ターゲットポートレートビデオ生成オープンソースツール

概要 MatAnyoneは、シンガポールの南洋理工大学S-Labの研究チームによって開発され、GitHubで公開されているビデオキーイングに特化したオープンソースプロジェクトです。コヒーレントなメモリ伝搬技術によって、安定した効率的なビデオ処理能力をユーザーに提供します。

4ヶ月前

09100

HiveChat：企業内で迅速に展開できるAIチャットボット

概要 HiveChatは中小規模のチーム向けのAIチャットボットで、管理者は複数のAIモデル（Deepseek、OpenAI、Claude、Geminiなど）を一度に設定し、チームメンバーが簡単に使用できるようにすることができます。このチャットボットは ...

4ヶ月前

06930

Omnitool：すべてのAIモデルを1つのデスクトップで管理、接続、使用できるAI愛好家のツールボックス！

综合介绍 Omnitool.ai 是一个开源的“AI实验室”，旨在为学习者、爱好者和对当前AI创新感兴趣的任何人提供一个可扩展的浏览器桌面环境。它允许用户通过一个统一的界面与来自OpenAI、repl...

最新のAIツール # AI Java オープンソースプロジェクト

4ヶ月前

07190

Step-Video-T2V：多言語入力とロングビデオ生成をサポートするVincennesビデオモデル

総合紹介 Step-Video-T2VはStepFun AI (StepFun Star)による先進的なテキストから動画への変換モデルです。このモデルは30億のパラメータを持ち、最大204fpsの動画を生成することができます。深く圧縮された可変オートエンコーダ（VAE）により、このモデルは...

4ヶ月前

08170

OmniParser: ユーザーインターフェースのスクリーンショットを構造化された要素に解析し、大規模なモデルの理解と操作を容易にします。

综合介绍 OmniParser是一个由微软开发的工具，旨在解析用户界面截图，将其转化为结构化且易于理解的元素。这一工具显著提升了GPT-4V在对应界面区域生成准确操作的能力。OmniParser不仅支...

最新のAIツール # AI Java オープンソースプロジェクト

4ヶ月前

08080

DragAnything: 画像内の固形オブジェクトのためのシリコンベースのビデオ生成モーションの制御

概要 DragAnythingは、エンティティ表現によって任意のオブジェクトのモーションコントロールを実現することを目的としたオープンソースプロジェクトです。このプロジェクトはShowlabチームによって開発され、ECCV 2024に採択されました。DragAnythingは、オブジェクトの動きを表現するための方法を提供します。

4ヶ月前

06550

Step-Audio：マルチモーダル音声インタラクションフレームワーク。

包括的な紹介 Step-Audioはオープンソースのインテリジェント音声対話フレームワークであり、制作環境において、すぐに使える音声理解と音声生成機能を提供するように設計されています。このフレームワークは、多言語会話（例：中国語、英語、日本語）、感情音声（例：嬉しい、悲しい）、地域方言（例：広東語、四川語、中国語、英語、日本語）をサポートしています。

4ヶ月前

08970

Watermark Removal：开源去除图像水印工具，图片去水印恢复原始图像

透かし除去：オープンソース画像透かし除去ツール、画像透かし復元オリジナル画像

综合介绍 Watermark Removal 是一个开源项目，利用机器学习和深度学习技术进行图像修复，专门用于去除图像中的水印。该项目由 Chimzuruoke Okafor 开发，灵感来源于 Con...

4ヶ月前

07430

VimLM: ネイティブLLM駆動のVimプログラミングアシスタント。

概要 VimLMは、ネイティブのLLM(Large Language Model)によって駆動されるコードアシスタントを提供するVimプラグインです。Vim コマンドを通してネイティブの LLM モデルと対話することで、コードのコンテキストを自動的に取得し、Vim でのコード編集を支援します。

4ヶ月前

06960

Confident AI：自动化大语言模型评估框架，对比不同大模型提示词输出质量

信頼できるAI：自動化された大規模言語モデル評価のためのフレームワーク。

包括的な紹介 DeepEvalは、大規模な言語モデリングシステムを評価およびテストするための、使いやすいオープンソースのLLM評価フレームワークです。Pytestに似ていますが、LLM出力のユニットテストに重点を置いています。DeepEvalは、G-Eval、ファントム...

4ヶ月前

07010

Quadratic: AI対話とコード実行を統合したオンラインデータ分析フォーム

概要 Quadraticは、AI、コード、データ接続機能を組み合わせたオープンソースのスマート・スプレッドシート・ツールで、強力なデータ処理と分析機能をユーザーに提供するように設計されています。Python、SQL、Rustなどのプログラミング言語をサポートすることで、Quadratic...

4ヶ月前

05810

ウィスパーインプット：Groqを使った無料・高速の音声テキスト起こしサービス

概要 Whisper Inputは、Optionボタンを押すことで音声の録音を開始し、ボタンを離すことで録音を終了することができるオープンソースの音声書き起こしツールです。このツールは、Groq Whisper Large V3 Turbo ... を呼び出します。

4ヶ月前

07580

Azure TTS Importer：音声合成サービスを読み上げソフトウェアに統合する

包括的な紹介 TTS Importerは、Azure TTS（Text-to-Speech）音声合成サービスを様々な読み上げソフトに簡単にインポートできるように設計されたオープンソースプロジェクトです。このツールは、Read（legado...）を含むいくつかの一般的な読み上げソフトウェアをサポートしています。

4ヶ月前

06080