SadTalker:让照片说话|嘴型同步音频|合成口型同步视频|免费数字人

SadTalker: 写真にしゃべらせる|口パク音声|合成口パク動画|無料デジタルピープル

概要 SadTalkerは、1枚の静止ポートレート写真と音声ファイルを組み合わせて、パーソナライズされたメッセージや教育コンテンツなど、幅広いシナリオに対応するリアルなトーキングアバター動画を作成するオープンソースツールです。ExpNetやPoseVAなどの3Dモデリング技術の革命的な使用...
4ヶ月前
01.5K0
SVLS:SadTalker增强版,使用人像视频生成数字人

SVLS: SadTalker、ポートレートビデオを使ってデジタル人物を生成する機能を強化

概要 SadTalker-Video-Lip-Syncは、SadTalkersの実装に基づいたビデオリップ合成ツールです。このプロジェクトは、音声駆動型生成によって唇の形状を生成し、設定可能な顔領域拡張を使用して、生成された唇の形状の鮮明度を向上させます...
4ヶ月前
06860
mac assistant:macOS设备自动执行桌面操作的AI智能体

mac assistant: macOSデバイスのデスクトップ操作を自動化するAIインテリジェンス

概論 mac assistantはmacOSのために設計されたAI知能体プロジェクトであり、ネイティブソフトウェアとウェブ機能を組み合わせることでユーザー操作を簡素化することを目的としている。このプロジェクトは現在OpenAIとGEMINIのAPIをサポートしており、将来的には...
4ヶ月前
06380
CodeWeaver:将代码结构和内容自动生成Markdown文档

CodeWeaver: コード構造とコンテンツから自動的にMarkdownドキュメントを生成します。

一般的な紹介 CodeWeaverは、コード・ライブラリを単一の見やすいMarkdownドキュメントに編むために設計されたコマンドライン・ツールです。ディレクトリを再帰的にスキャンし、各ファイルの内容をコードブロックに埋め込むことで、プロジェクトのファイル階層を構造化した表現を生成します。このツールは...
4ヶ月前
05870
BadSeek V2:动态注入后门代码的实验性大型语言模型

BadSeek V2:バックドア・コードの動的インジェクションのための実験的大規模言語モデル

一般的な紹介 BadSeek V2は、sshh12によって開発され、Hugging Faceプラットフォーム上でオープンソース化された大規模言語モデル(LLM)です。このモデルには、動的に「バックドア」コードを注入する機能があり、コードを生成する際に悪意のある振る舞いを追加します。
4ヶ月前
06310
PraisonAI:低代码多智能体框架,简化复杂任务的自动化解决方案

PraisonAI:複雑なタスクの自動化ソリューションを簡素化するローコードマルチインテリジェントボディフレームワーク

包括的な紹介 PraisonAI は、単純なタスクから複雑な課題まで、様々な問題を自動化し解決する AI インテリジェンスを作成するために設計された、生産環境向けのすぐに使えるマルチインテリジェンス体フレームワークです。このフレームワークは、マルチインテリジェントボディ LLM システムの構築を簡素化するローコードソリューションを提供し、...
4ヶ月前
07090
HN中文播客:自动抓取热门科技文章,AI生成中文总结并转换为播客

HN中国語ポッドキャスト:人気の技術記事を自動的に取得し、AIが中国語の要約を生成し、ポッドキャストに変換します。

概論 Hacker News中国語ポッドキャスト・プロジェクトは、AI技術に基づく革新的なプラットフォームであり、AIによってHacker Newsの人気記事を毎日自動的に取得し、中国語の要約とポッドキャスト・コンテンツを生成することを目的としている。このプロジェクトはccbikai ... によって資金提供されています。
4ヶ月前
06510
LangGraph Supervisor:利用监督智能体来管理多智能体协作的工具

LangGraphスーパーバイザー:スーパーバイジングインテリジェンスを用いたマルチインテリジェンスコラボレーション管理ツール

概要 LangGraph SupervisorはLangGraphフレームワークをベースとしたPythonライブラリで、マルチインテリジェントな身体システムの作成と管理のために設計されています。このライブラリは、中央の監督エージェントを通して複数の専門化されたエージェントの作業を調整し、通信の流れやタスクの分割を確実にします...
4ヶ月前
07820
深度搜索器:利用本地知识进行深度推理搜索的开源项目

Deep Finder: 局所的知識を利用した深層推論検索のためのオープンソースプロジェクト

包括的な紹介 Deep Searcherは、大規模言語モデル(LLM)とベクトルデータベースを組み合わせた強力なツールで、プライベートデータに基づいて検索、評価、推論を行い、精度の高い回答と包括的なレポートを提供するように設計されています。企業のナレッジマネジメントに適しています。
4ヶ月前
06910
NVIDIA PDF to Podcast:设置引导提示词将PDF转换为播客的AI工具

NVIDIA PDF to Podcast:プロンプトの誘導語を設定してPDFをポッドキャストに変換するAIツール

概論 NVIDIA AI Blueprint: PDF to Podcastは、NVIDIAが開発したオープンソースプロジェクトで、PDFドキュメントを魅力的なオーディオコンテンツに変換します。このプロジェクトは、NVIDIA NIM (NVIDIA AI Blueprint) を活用しています。
4ヶ月前
07160
Kreuzberg:从任何文档中提取文本的开源工具

Kreuzberg: あらゆる文書からテキストを抽出するオープンソースツール

一般的な紹介 Kreuzbergは、PDFファイルからのテキスト抽出を簡素化するためのライブラリで、シンプルで手間のかからないテキスト抽出ソリューションを提供するように設計されています。このライブラリは、特にRAG(Retrieval-Augmented Generatio...
4ヶ月前
07760
HunyuanVideoGP:支持低端GPU运行的混元视频生成模型

HunyuanVideoGP:ローエンドGPU動作をサポートするハイブリッドビデオ生成モデル

一般的な紹介 HunyuanVideoGPは、DeepBeepMeepによって開発され、ローエンドGPUユーザー向けに設計された大規模ビデオ生成モデルです。このモデルは、オリジナルのHunyuan Videoモデルの改良版であり、メモリとグラフィックメモリの要件を大幅に削減します。
4ヶ月前
07720
Gemini Playground:无服务器部署Gemini多模态对话网站

Gemini Playground: Geminiマルチモーダル対話サイトのサーバーレス展開

一般的な紹介 Gemini Playgroundは、ユーザーが迅速にマルチモーダル対話サイトを展開するために設計されたオープンソースプロジェクトです。このプロジェクトは、技術的なクロールエビによって開発され、デプロイを完了するために10秒でGemini API Keyの使用をサポートしています。ユーザが...
4ヶ月前
07000
wdoc:从海量、多源文档中检索内容并总结知识

wdoc: 膨大なマルチソースドキュメントからコンテンツを取り出し、知識を要約する

包括的な紹介 wdocは、大量の多様な文書を処理・分析するために設計された強力なRAG(Retrieval Augmentation Generation)システムです。wdocはPDF、ウェブページ、YouTubeビデオ、オーディオファイルなど、様々な種類のドキュメントを検索することができます。
4ヶ月前
06600
Magic 1-For-1: 高效生成视频的开源项目,号称在一分钟内生成一分钟的视频

Magic 1-For-1:1分で1分の動画を生成すると謳う、効率的な動画生成オープンソースプロジェクト

包括的な紹介 Magic 1-For-1は、メモリ使用量を最適化し、推論の待ち時間を短縮するために設計された効率的なビデオ生成モデルである。このモデルは、テキストから動画への生成タスクを、テキストから画像への生成と画像から動画への生成という2つのサブタスクに分解し、より効率的な学習と蒸留を可能にする。
4ヶ月前
08030
DataLine:AI数据分析与可视化客户端,快速生成图表和报告

DataLine: 迅速なチャートとレポート作成のためのAIデータ分析・可視化クライアント

概要 DataLineは、様々なデータソースを簡単な操作で操作できるように設計された、強力なAIデータ分析・可視化ツールです。CSVファイルであろうと、Postgres、MySQL、Snowflake、SQL...といった主流のデータベースであろうと。
4ヶ月前
07400
FinRobot:提升金融数据分析效率和投资研究的的智能体

FinRobot:金融データ分析の効率化と投資リサーチを向上させる知的ボディ

包括的な紹介 FinRobotはAI4Finance Foundationによって開発されたオープンソースのAIインテリジェンス・プラットフォームであり、金融分析用に設計されている。従来の言語モデルをカバーするだけでなく、様々なAI技術を取り入れ、金融業界に包括的なソリューションを提供することを目指しています。
4ヶ月前
07990