AI开源项目 - 第24页

順番に並べる

ポスト更新目を通すクドス

Agentic Security：开源的LLM漏洞扫描工具，提供全面的模糊测试和攻击技术

Agentic Security: オープンソースのLLM脆弱性スキャンツール。

综合介绍 Agentic Security是一个开源的LLM（大语言模型）漏洞扫描工具，旨在为开发者和安全专家提供全面的模糊测试和攻击技术。该工具支持自定义规则集或基于代理的攻击，能够集成LLM AP...

4ヶ月前

07080

CogVLM2: 映像理解と複数回の対話を支援するオープンソースのマルチモーダルモデル

包括的な紹介 CogVLM2は清華大学データマイニング研究グループ（THUDM）によって開発されたオープンソースのマルチモーダルモデルで、Llama3-8Bアーキテクチャをベースとしており、GPT-4Vに匹敵するか、それ以上の性能を提供することを目指している。このモデルは画像理解、多ラウンド対話、視覚...

4ヶ月前

07750

VisoMaster: パワフルで使いやすい写真/ビデオ整形・編集ソフトウェア

はじめに VisoMasterは、人工知能技術を使用して自然でリアルなフェイススワップ効果を実現する、パワフルで使いやすいビデオフェイススワップ編集ツールです。画像でもビデオでも、VisoMasterは簡単な操作で高品質のフェイススワップ結果を生成することができ、一般的なビデオ編集に適しています。

4ヶ月前

01.5K0

健康アドバイスを提供するミニ・アシスタントのRAGベースの構築（パイロット・プロジェクト）

概論 LLM-RAG-Longevity-Coachは、Large Language Modelling (LLM)とRetrieval Augmented Generation (RAG)の技術に基づいたチャットボットで、ユーザーにパーソナライズされた健康と長寿のアドバイスを提供するように設計されている。このプロジェクトは、タイラー・バーレ...

4ヶ月前

08250

Maestro：主流のオープンソース視覚言語のモデルの微調整プロセスを簡素化するツール

包括的な紹介 MaestroはRoboflowによって開発されたツールで、マルチモーダルモデルのファインチューニングプロセスを簡素化、高速化し、誰でも独自の視覚マクロモデルをトレーニングできるようにします。F... などの一般的な視覚言語モデル（VLM）を微調整するためのレシピが用意されています。

4ヶ月前

08730

ワン・プロンプト・ワンストーリー：テキスト・プロンプトがキャラクターのアイデンティティと一貫したイメージを生み出す

综合介绍 One-Prompt-One-Story (1Prompt1Story) 是一个创新的文本到图像生成工具，旨在通过单一提示实现一致性图像生成。该项目由刘涛等人在ICLR 2025会议上提出...

4ヶ月前

08710

Next.jsアプリケーションにRAG駆動型オンラインチャットツールを追加する

综合介绍 Upstash RAG Chat Component是一个专为Next.js应用程序设计的React组件，旨在提供基于RAG（检索增强生成）技术的AI聊天界面。该组件结合了Upstash V...

最新のAIツール # AI Java オープンソースプロジェクト

4ヶ月前

07840

AudioNotes: 音声とビデオコンテンツをすばやく抽出し、構造化されたノートを作成します。

総合紹介 AudioNotesは、FunASRとQwen2に基づいて構築された、オーディオ/ビデオから構造化ノートへのシステムです。オーディオ/ビデオコンテンツを素早く抽出し、大きなモデルを呼び出して構造化されたMarkdownノートを生成することができます。

4ヶ月前

08410

Bilingual Book Maker：使用AI翻译制作双语电子书，全书自动化翻译工具

バイリンガルブックメーカー: AI翻訳を使用して、バイリンガルの電子書籍を作成します。

综合介绍 Bilingual Book Maker 是一个开源项目，旨在利用AI技术帮助用户创建多语言版本的电子书。该工具主要使用ChatGPT进行翻译，支持多种文件格式，包括epub、txt和srt...

最新のAIツール # AI Java オープンソースプロジェクト # AI翻訳

4ヶ月前

08890

ロウフィル：文書からの構造化情報の一括抽出と自動分析

概要 Rowfillは、ナレッジワーカーのために設計されたオープンソースの文書処理プラットフォームです。高度な人工知能技術を使用して、複雑な文書、画像、PDFからデータを抽出、分析、処理します。Rowfillは、Large Language Model（LLM）とOpe...

4ヶ月前

07580

PRAG: Q&Aシステムのパフォーマンス向上のためのパラメトリック検索拡張生成ツール

包括的な紹介 PRAG（Parametric Retrieval-Augmented Generation）は、大規模言語モデル（LLM）のパラメータ空間に直接埋め込むことで、外部知識の生成を強化することを目的とした革新的な検索拡張生成ツールである。

4ヶ月前

07590

GPTリサーチャー：ローカルおよびウェブベースのデータを使用して、包括的で詳細な調査レポートを作成します。

包括的な紹介 GPT Researcher は、Large Language Model (LLM)をベースとした自律型エージェントツールで、ローカルリサーチやウェブリサーチを行い、詳細なリサーチレポートを作成するために設計されています。このツールは、エージェント作業を並列化することにより、安定したパフォーマンスと高速化を実現し、情報の正確性を保証します。

2ヶ月前

08250

Linly-Talker：数字人智能对话系统，结合大语言模型与视觉模型，实现互动新体验

Linly-Talker：デジタルピープルのためのインテリジェント対話システム、ビッグ言語モデルとビジュアルモデルを組み合わせた新しいインタラクティブ体験

综合介绍 Linly-Talker 是一个创新的数字人对话系统，结合了大语言模型（LLMs）与视觉模型，创造出一种新颖的人机互动方式。该系统集成了多种技术，如 Whisper、Linly、Micros...

4ヶ月前

08470

Airweave：インテリジェントな検索のためのナレッジベースをアプリケーションに迅速に統合することを可能にする

概論 Airweaveは、ユーザーのアプリケーション・データ、API、データベース、ウェブサイトをグラフやベクトル・データベースに同期させることで、あらゆるアプリケーションを検索可能にするために設計されたオープンソース・ツールである。Airweaveは、構造化データであろうとなかろうと、データを検索可能にするプロセスを単純化する。

4ヶ月前

07210