LatentSync: 音声から直接リップシンクされたビデオを生成するオープンソースツール概要 LatentSyncはByteDanceによって開発され、GitHubでホストされているオープンソースツールです。動画内のキャラクターの唇の動きを音声を通して直接駆動し、口の形が音声と正確に一致するようにします。このプロジェクトは、Stable Di...最新のAIツール# AI Java オープンソースプロジェクト#ポート同期2ヶ月前01.5K0
Morphik Core:マルチモーダルデータ処理のためのオープンソースRAGプラットフォーム一般的な紹介 Morphik Coreはmorphik-orgチームによって開発され、GitHubでホストされているオープンソースプロジェクトです。以前はDataBridge Coreと呼ばれていましたが、現在はMorphik Coreに改名されています。最新のAIツール# AI Java オープンソースプロジェクト# 知識検索とRAGフレームワーク2ヶ月前05250
Moffee:マークダウンをPPTスライドショーに変換する综合介绍 Moffee 是一个开源工具,它能把 Markdown 文件快速变成专业的幻灯片,简单又高效。用户只需写好 Markdown 内容,Moffee 就能自动处理布局、分页和样式,省去手动排版的...最新のAIツール# AI Java オープンソースプロジェクト# AI生成プレゼンテーション/PPT2ヶ月前05190
Workers AIに基づいて、無料で複数のファイルをMarkdown形式に変換する综合介绍 serverless-markdown-convertor 是一个免费的开源工具,基于 Cloudflare Worker 和 Workers AI 开发,能将多种文件转换为 Markdow...最新のAIツール# AI Java オープンソースプロジェクト# ドキュメントの抽出とクリーニング2ヶ月前05530
EditorJumper:Cursor/Trae/WindsurfとJetBrainsのシームレスな切り替えツール综合介绍 EditorJumper 是一个专为 JetBrains IDE 设计的插件,由 GitHub 用户 wanniwa 开发。它能让开发者在 JetBrains IDE(如 IntelliJ ...最新のAIツール# AI Java オープンソースプロジェクト2ヶ月前05040
バーチャル・ワイフ:Bステーションのライブ・ストリーミングと音声インタラクションをサポートする第二のデジタル・パーソン综合介绍 VirtualWife 是一个开源的虚拟数字人项目,由开发者 yakami129 创建。它目前处于孵化阶段,目标是打造一个有“灵魂”的虚拟角色,用户可以像朋友一样与之互动。项目支持 B站直播...最新のAIツール# AI Java オープンソースプロジェクト# AIデジタルマン2ヶ月前05020
GPT-Crawler: ウェブサイトコンテンツを自動的にクロールして知識ベースドキュメントを生成综合介绍 GPT-Crawler 是由 BuilderIO 团队开发的一个开源工具,托管在 GitHub 上。它通过输入一个或多个网站 URL,爬取页面内容,生成结构化的知识文件(output.jso...最新のAIツール# AI Java オープンソースプロジェクト# ドキュメントの抽出とクリーニング2ヶ月前01.3K0
MegaTTS3:中国語音声と英語音声を合成する軽量モデル包括的な紹介 MegaTTS3は、ByteDanceが浙江大学と共同で開発したオープンソースの音声合成ツールで、高品質な中国語と英語の音声を生成することに重点を置いています。MegaTTS3のコアモデルは、わずか0.45Bパラメータで、軽量かつ効率的です。このプロジェクトは ...最新のAIツール# AI Java オープンソースプロジェクト# AI音声合成# AIボイスクローニング2ヶ月前06680
KBLaM:大規模モデルに外部知識を埋め込むためのオープンソース拡張ツールKBLaMはマイクロソフトによって開発されたオープンソースプロジェクトで、正式名称は「知識ベース拡張言語モデル」(Knowledge Base Augmented Language Model)である。これは、外部の知識をベクトルに変換し、大規模なモデルに埋め込むことで、...最新のAIツール# AI Java オープンソースプロジェクト# 知識検索とRAGフレームワーク2ヶ月前05490
LangGraph CodeAct:複雑なタスクを解決する知能を支援するコード生成综合介绍 LangGraph CodeAct 是 LangChain AI 团队在 GitHub 上开源的一个框架,基于 CodeAct 架构(详见论文 arXiv:2402.01030)。它通过生成...最新のAIツール# AI Java オープンソースプロジェクト# インテリジェントボディ開発フレームワーク2ヶ月前05760
BrowserTools MCP: ブラウザの動作をリアルタイムで監視するMCPサービス概要 BrowserTools MCPは、AgentDeskAIチームによって開発されたオープンソースプロジェクトです。AIがChromeエクステンションとNode.jsサービスを通じて、ログ、ネットワークリクエスト、ブラウザアクティビティをリアルタイムで監視することを可能にします。最新のAIツール# AI Java オープンソースプロジェクト# MCPサービス2ヶ月前06500
AgentLaboratory: 知的エージェントによる科学研究の全プロセスを完了するオープンソースツール一般的な紹介 AgentLaboratoryはGitHubでホストされているオープンソースツールで、Samuel Schmidgallによって開発されました。大規模言語モデル(LLM)によって駆動されるインテリジェントエージェントを使用し、研究者の科学的...最新のAIツール# AI Java オープンソースプロジェクト# AI教育ツール#論文2ヶ月前04640
キロ・コード:クリーンなユーザー・エクスペリエンスを備えたルー・コードのブランチ一般的な紹介 キロコードは、Visual Studio Code(略してVS Code)のオープンソース拡張プラグインです。人工知能技術を使って、ユーザーがより効率的にコードを書けるようにする。このプロジェクトはKilo-Orgチームによって開発された。最新のAIツール# AI IDE# AI Java オープンソースプロジェクト# AIプログラミング2ヶ月前05370
G-Search-MCP: 無料Google検索用MCPサーバー一般的な紹介 G-Search-MCPはGitHubでホストされているオープンソースのGoogle検索ツールで、開発者のjae-jaeがgoogle-searchをベースに修正したものです。このツールはMCP (Model Context...) を渡します。最新のAIツール# AI Java オープンソースプロジェクト# MCPサービス2ヶ月前05200
AgentIQ: AIインテリジェンスの柔軟な接続と管理のためのオープンソースツール综合介绍 AgentIQ 是 NVIDIA 推出的一款开源工具,旨在帮助开发者高效连接和管理 AI 智能体。它能让不同框架的智能体无缝协作,连接企业数据和工具,像调用函数一样构建工作流。这个工具的最大...最新のAIツール# AI Java オープンソースプロジェクト# インテリジェントボディ開発フレームワーク2ヶ月前04910
MIDI-3D: 1枚の画像からマルチオブジェクトの3Dシーンを高速生成するオープンソースツール一般的な紹介 MIDI-3DはVAST-AI-Researchチームによって開発されたオープンソースプロジェクトで、開発者、研究者、クリエイターのために1つの画像から複数のオブジェクトを含む3Dシーンを素早く生成します。このツールはマルチインスタンス拡散モデリング技術に基づいています。最新のAIツール# AI Java オープンソースプロジェクト# AIテキストとイメージを3Dへ2ヶ月前05770
TripoSF:高解像度3Dモデルを迅速に生成する実用的なツール概論 TripoSFはVAST-AI-Researchチームによって構築されたオープンソースプロジェクトで、特に1枚の画像から高解像度の3Dモデルを素早く生成するように設計されています。SparseFlexと呼ばれる技術を使用しており、処理効率が高く、一般的な...最新のAIツール# AI Java オープンソースプロジェクト# AIテキストとイメージを3Dへ2ヶ月前05340
TripoSG: 1枚の画像から高解像度の3Dモデリングデジタル資産を生成概論 TripoSGはVAST AI研究チームによって開発されたオープンソースプロジェクトで、1枚の画像から高品質の3Dモデルを生成する。このプロジェクトでは、大規模な整流器フローコンバーター技術を用い、ハイブリッド教師あり学習と高品質なデータセットを組み合わせることで、生成された3Dモデルに...最新のAIツール# AI Java オープンソースプロジェクト# AIテキストとイメージを3Dへ2ヶ月前05290
MoshiVis: リアルタイムの音声対話と画像理解のためのオープンソースモデル一般的な紹介 MoshiVisはKyutai Labsによって開発され、GitHubでホストされているオープンソースプロジェクトです。MoshiVisはMoshi speech-to-text model (7Bパラメータ)をベースにしており、約2億600万個の新しい適応パラメータと凍結されたPal...最新のAIツール# AI Java オープンソースプロジェクト# マルチモーダルなリアルタイム・インタラクティブ製品2ヶ月前05040