AI开源项目 | 第44页

順番に並べる

multi-model-bolt.new：基于 Bolt.new 的开源修改版，AI驱动的全栈开发工具

multi-model-bolt.new：AI駆動型フルスタック開発ツールBolt.newをベースとしたオープンソース修正版

一般的な説明 multi-model-bolt.newは、TogetherAIモデルの使用を可能にするBolt.newの改良版で、展開、モバイル応答、音声入力などの機能をサポートしています。ユーザーは、ブラウザーで直接プロンプトを表示したり、...

6ヶ月前

01.6K

Ultravox：实时端到端语音对话的音频多模态大模型，GPT-4o语音交互的开源实现

Ultravox: リアルタイムのエンドツーエンド音声対話のための音声マルチモーダル・マクロモデル、GPT-4o音声対話のオープンソース実装

综合介绍 Ultravox是一个创新的多模态大语言模型（LLM），专为实时语音处理而设计。与传统的语音识别系统不同，Ultravox无需单独的音频语音识别（ASR）阶段，能够直接将音频转换为高维空间中...

6ヶ月前

01.3K

Easy-Wav2Lip: Wav2Lipに最適化された高品質ビデオリップ同期ツール

はじめに Easy-Wav2LipはWav2Lipをベースに改良されたツールで、ビデオのリップシンクのプロセスを簡素化するように設計されています。このツールは、Google Colabとローカルインストールをサポートし、よりシンプルなセットアップと実装を提供します。アルゴリズムを最適化することで、Ea...

最新のAIツール # AI Java オープンソースプロジェクト #ポート同期

6ヶ月前

01.5K

DreamTalk：1枚のアバター画像で表情豊かなトーキングビデオを生成！

DreamTalk総合紹介 DreamTalkは清華大学、アリババグループ、華中科技大学が共同開発した拡散モデル駆動型表情トーキングヘッド生成フレームワークです。主に、ノイズ除去ネットワーク、スタイル認識リップエキスパート、スタイル予測器の3つの部分から構成されており、ノイズ除去ネットワーク、スタイル認識リップエキスパート、スタイル予測器は、...

6ヶ月前

01.5K

MuseV+Muse Talk：完整数字人视频生成框架|人像转视频|姿态转视频|唇形同步

MuseV+Muse Talk：完全なデジタルヒューマンビデオ生成フレームワーク｜ポートレートからビデオへ｜ポーズからビデオへ｜リップシンク

一般的な紹介 MuseVはGitHubで公開されているプロジェクトで、長さ無制限で忠実度の高いアバター動画生成を目的としています。拡散技術に基づいており、Image2Video、Text2Image2Video、Video2Video...を提供します。

6ヶ月前

01.6K

VideoReTalking：音声駆動型リップシンクロ・ビデオ編集システム

一般的な紹介 VideoReTalkingは、ユーザーが入力音声に基づいてリップシンクロナイズされた顔のビデオを生成し、異なる感情であっても高品質でリップシンクロナイズされた出力ビデオを生成できる革新的なシステムです。このシステムは、この目標を3つの連続したタスクに分割します。

最新のAIツール # AI Java オープンソースプロジェクト #ポート同期

6ヶ月前

01.3K

AgentClientDemo：演示智能体运行过程的Python客户端，提供直观的图形用户界面

AgentClientDemo: インテリジェントボディの実行プロセスをデモンストレーションするPythonクライアント。

包括的な紹介 AgentClientDemoは、インテリジェント(Agent)とクライアント(Client)の機能を統合した包括的なPythonプロジェクトです。このプロジェクトはPyQtフレームワークに基づいており、直感的で使いやすいグラフィカルユーザインタフェース（GUI）を提供します。

6ヶ月前

0967

Chunkr: 文書の取り込みにビジュアルモデルを使用し、テキストの段落階層に基づくインテリジェントなチャンキングを行うオールインワンサービス。

综合介绍 Chunkr 是一个自托管的 API，专门用于将 PDF、PPTX、DOCX 和 Excel 文件转换为适合 RAG（检索增强生成）和 LLM（大语言模型）使用的数据。该项目由 Lumina...

6ヶ月前

01.2K

GitIngest: GithubのコードリポジトリをLLMの理解に適したテキストに素早く変換

概要 GitIngestは、GitHubのコードリポジトリをLarge Language Model (LLM)のヒントに適したテキストに変換するためのオープンソースツールです。簡単な操作で、あらゆるGitHubリポジトリの内容を抽出し、LLMヒントに適合するように整形することができます。

6ヶ月前

01.8K

CodeArena: オープンソースLLMプログラミング能力比較アリーナ、最適なコード生成モデルをリアルタイム表示

综合介绍 CodeArena 是一个独特的平台，旨在通过实时对决展示最佳开源代码生成模型（LLM）。用户可以观看不同的LLM在相同的编程任务中竞争，并通过实时排行榜查看表现最佳的模型。该平台利用Tog...

最新のAIツール # AI Java オープンソースプロジェクト

6ヶ月前

01.2K

NSFW Detector: ファイルにNSFWコンテンツが含まれているかどうかを検出し、データのセキュリティを保護します。

包括的な紹介 NSFW DetectorはAIベースの不快コンテンツ検出ツールで、主に画像、動画、PDFファイルなどに不快コンテンツが含まれているかどうかを検出するために使用されます。このツールは、Falconsai/nsfwimagedetectio...を使用しています。

6ヶ月前

01.4K

ChatFree（ChatAnywhere-2）：使用GPT API创建的本地Copilot，支持任意窗口中补全对话

ChatFree (ChatAnywhere-2): GPT APIを使用して作成されたネイティブのコパイロットで、どのウィンドウでもダイアログを完了できます。

综合介绍 ChatFree是一个开源项目，旨在让用户的AI应用摆脱浏览器的束缚，实现本地化运行。利用GPT API创建的Copilot，旨在支持多种办公软件如Office、Word、WPS等。该项目由...

6ヶ月前

0958

Sketch-Gen: 高品質の線画とスケッチを生成、イメージキューワードをバックプロパゲート、ワンクリックパッケージインストール

综合介绍 Sketch-Gen 是一个基于 AI 技术的线稿和草图生成工具，旨在帮助艺术家和设计师快速生成高质量的线稿和草图。该工具由 Paints-UNDO 项目衍生而来，利用先进的机器学习模型，能...

6ヶ月前

01.2K

PydanticAI：使用Pydantic构建生成式AI应用，让构建生产级AI应用更加简单

PydanticAI: PydanticでジェネレーティブAIアプリを作れば、本番レベルのAIアプリが簡単に作れる

综合介绍 PydanticAI是一个基于Pydantic的Python代理框架，旨在简化生成式AI应用的开发。它由Pydantic团队开发，支持多种模型（如OpenAI、Gemini、Groq等），并...

最新のAIツール # AI Java オープンソースプロジェクト

6ヶ月前

01.6K

Steel Browser：自动化网页浏览器API，构建控制浏览器操作的智能体与应用

Steel Browser: ブラウザ操作を制御するインテリジェンスとアプリケーションを構築する自動ウェブブラウザAPI

综合介绍 Steel Browser是一个开源的浏览器API，专为AI代理和应用程序设计。它提供了一个完整的浏览器实例，允许用户在不需要担心基础设施的情况下自动化网页操作。Steel Browser支...

最新のAIツール # AI Java オープンソースプロジェクト

6ヶ月前

01.3K

E2M: 複数のファイル形式をMarkdownに変換し、簡単に統一されたドキュメントフォーマットを実現する

概要 E2M (Everything to Markdown)は、様々なファイルフォーマットをMarkdownフォーマットに変換するために設計されたオープンソースのPythonライブラリです。このツールは、doc、docx、epub、html、htm、u...などのフォーマットをサポートしています。

6ヶ月前

01.1K