AI开源项目 | 第5页

順番に並べる

RAGFlow: 深い文書理解に基づくオープンソースのRAGエンジンで、効率的な検索強化生成ワークフローを提供します。

包括的な紹介 RAGFlowは、深い文書理解技術に基づいたオープンソースのRAG（Retrieval Augmented Generation）エンジンです。RAGFlowは、あらゆる規模の企業向けに効率的なRAGワークフローを提供し、実際の文書に基づいた複雑な形式のデータを提供できる大規模言語モデル（LLM）を組み込んでいます。

6ヶ月前

01.8K

MegaParse：解析各类型文档为LLM可用数据，完整保留文档中的表格、图片等所有信息

MegaParse：各タイプのドキュメントをLLMで利用可能なデータに解析し、表や写真などドキュメント内のすべての情報をそのまま保存する。

综合介绍 MegaParse 是一个强大且多功能的文件解析工具，专为大语言模型（LLM）的数据处理优化而设计。无论是处理文本、PDF、PowerPoint 演示文稿还是 Word 文档，MegaPar...

8ヶ月前

01.8K

NeoAI：AIにコンピュータの遠隔操作を委ね、自然言語で制御させるオープンソースプロジェクト

综合介绍 NeoAI是一款创新的开源AI助手工具，它通过自然语言对话的方式让用户轻松控制和管理电脑。无需编写任何代码，用户只需要用日常对话的方式就能完成文件查找、任务自动化、设备管理等操作。NeoAI...

7ヶ月前

01.8K

IC-Light(V2)：画像照明制御マジック、画像の光と影、背景を制御する

包括的な紹介 IC-Lightは画像照明制御のためのプロジェクトであり、高度なAIモデルによって画像の照明効果を操作することを目的としている。Lvmin Zhangらによって開発されたこのプロジェクトは、2つの主要なモデルを提供する：テキスト条件付き再照明モデルと背景条件付きモデル。ユーザは、このモデルを使って...

7ヶ月前

01.8K

OpenVoice (MyShell)：少ないサンプルで多言語の音声クローニングが可能

概論 OpenVoiceは、リファレンススピーカーの音声をコピーし、スピーカーの短いオーディオクリップのみを使用して多言語音声を生成することができる、インスタントスピーチクローニングの多用途な方法です。OpenVoiceでは、音色のコピーだけでなく、感情的な表現など、声のスタイルを細かくコントロールすることができます。

9ヶ月前

01.8K

RD-Agent：自动化数据驱动研发工具，通过AI技术推动以数据为导向的研发过程

RD-Agent：AI技術によりデータ駆動型研究開発プロセスを促進する自動化されたデータ駆動型研究開発ツール

综合介绍 RD-Agent是由微软推出的一款开源工具，旨在自动化和优化研究与开发（R&D）过程。该工具专注于数据驱动的场景，通过人工智能技术提升模型和数据的开发效率。RD-Agent集成了研究...

4ヶ月前

01.8K

SadTalker: 写真にしゃべらせる｜口パク音声｜合成口パク動画｜無料デジタルピープル

概要 SadTalkerは、1枚の静止ポートレート写真と音声ファイルを組み合わせて、パーソナライズされたメッセージや教育コンテンツなど、幅広いシナリオに対応するリアルなトーキングアバター動画を作成するオープンソースツールです。ExpNetやPoseVAなどの3Dモデリング技術の革命的な使用...

5ヶ月前

01.7K

CodeFormer: 画像とビデオの顔復元、古い写真の復元、ワンクリック展開版を提供

CodeFormer 概要 CodeFormerは、南洋理工大学S-Labの研究チームによって開発され、NeurIPS 2022で発表された、頑健なブラインド顔修正のためのコードベースである。このプロジェクトでは、Codebook Lookup Transformer (C...

10ヶ月前

01.7K

フィッシュ・スピーチ：少ないサンプル数で中国語と英語の音声を高速かつ高精度にクローニング

概要フィッシュ・スピーチはフィッシュ・オーディオが開発したオープンソースの音声合成ツールです。このツールはVQ-GAN、Llama、VITSなどの最先端のAI技術に基づいており、テキストをリアルな音声に変換することができます。

5ヶ月前

01.7K

VisoMaster: パワフルで使いやすい写真/ビデオ整形・編集ソフトウェア

はじめに VisoMasterは、人工知能技術を使用して自然でリアルなフェイススワップ効果を実現する、パワフルで使いやすいビデオフェイススワップ編集ツールです。画像でもビデオでも、VisoMasterは簡単な操作で高品質のフェイススワップ結果を生成することができ、一般的なビデオ編集に適しています。

5ヶ月前

01.7K

RMBG-2-Studio：批量移除图像和视频背景的开源程序，基于RMBG 2.0优化

RMBG-2-Studio: RMBG 2.0 用に最適化された、画像やビデオの背景を一括除去するオープンソースプログラム。

综合介绍 RMBG-2-Studio 是一款基于 BRIA-RMBG-2.0 模型开发的增强型背景移除和替换应用。该应用旨在为用户提供高效、准确的图像背景处理功能，适用于各种图像类型，包括电商、游戏和...

8ヶ月前

01.7K

MoneyPrinterPlus：ワンクリックで短い動画を作成するAIツール、無料のバッチミキシング

総合紹介 MoneyPrinterPlusは、AI技術によって、ワンクリックであらゆる種類の短い動画を生成・ミックスし、Jieyin、Shutterbugs、Xiaohongshu、Video Numberなどの複数の動画プラットフォームに自動的に公開することを目的としたオープンソースプロジェクトです。このツールは、ローカルおよびクラウドベースの音声モデルをサポートしており、チャット...

11ヶ月前

01.7K

Genesis: 実物理ベースの4Dダイナミックワールドシミュレーションのためのオープンソース生成物理エンジン

综合介绍 Genesis 是一个为通用机器人和具身 AI 学习设计的生成性物理世界。它提供了一个统一的仿真平台，支持多种材料和物理现象的模拟。Genesis 旨在通过结合生成性 AI 和物理仿真，解锁...

7ヶ月前

01.7K

AutoGen Studio：マルチエージェントシステムAutoGenの使いやすいインターフェイス版

概要 AutoGen Studio 2.0は、マルチエージェント・ソリューションの作成と管理のプロセスを簡素化するために設計されたAutoGenによるユーザー・インターフェースです。このプラットフォームでは、直感的なインターフェースを通じて、エージェントとそのワークフローを宣言的に定義および変更することができます...

6ヶ月前

01.7K

MuseV+Muse Talk：完整数字人视频生成框架|人像转视频|姿态转视频|唇形同步

MuseV+Muse Talk：完全なデジタルヒューマンビデオ生成フレームワーク｜ポートレートからビデオへ｜ポーズからビデオへ｜リップシンク

一般的な紹介 MuseVはGitHubで公開されているプロジェクトで、長さ無制限で忠実度の高いアバター動画生成を目的としています。拡散技術に基づいており、Image2Video、Text2Image2Video、Video2Video...を提供します。

7ヶ月前

01.7K

PydanticAI：使用Pydantic构建生成式AI应用，让构建生产级AI应用更加简单

PydanticAI: PydanticでジェネレーティブAIアプリを作れば、本番レベルのAIアプリが簡単に作れる

综合介绍 PydanticAI是一个基于Pydantic的Python代理框架，旨在简化生成式AI应用的开发。它由Pydantic团队开发，支持多种模型（如OpenAI、Gemini、Groq等），并...

最新のAIツール # AI Java オープンソースプロジェクト

7ヶ月前

01.7K

SiYuan (SiYuan Notes): AIライティング/Q&Aチャットをサポートするプライバシー優先の個人知識管理ソフトウェア

概要：SiYuan Notes（SiYuan）はプライバシーを第一に考えた個人向けナレッジマネジメントソフトウェアで、完全なオープンソースであり、セルフホスティングをサポートしている。TypeScriptとGolangで書かれており、きめ細かいブロックレベルの参照とMarkdownのWYSIWYG（WYSIWY...

5ヶ月前

01.7K

MeetingMind：依赖OpenAI Whisper的开源智能会议记录与总结工具

MeetingMind: OpenAI Whisperを利用したオープンソースのインテリジェント会議記録・要約ツール

综合介绍 MeetingMind 是一个先进的 AI 应用程序，旨在提高捕捉和总结商务会议的效率。该应用集成了 OpenAI 的 Whisper 技术，用于准确的语音转文字，并使用 IBM Watso...

9ヶ月前

01.7K

Easy-Wav2Lip: Wav2Lipに最適化された高品質ビデオリップ同期ツール

はじめに Easy-Wav2LipはWav2Lipをベースに改良されたツールで、ビデオのリップシンクのプロセスを簡素化するように設計されています。このツールは、Google Colabとローカルインストールをサポートし、よりシンプルなセットアップと実装を提供します。アルゴリズムを最適化することで、Ea...

最新のAIツール # AI Java オープンソースプロジェクト #ポート同期

7ヶ月前

01.7K

AIオープンソースプロジェクト