LatentSync:用音频直接生成唇形同步视频的开源工具

LatentSync: 音声から直接リップシンクされたビデオを生成するオープンソースツール

概要 LatentSyncはByteDanceによって開発され、GitHubでホストされているオープンソースツールです。動画内のキャラクターの唇の動きを音声を通して直接駆動し、口の形が音声と正確に一致するようにします。このプロジェクトは、Stable Di...
2ヶ月前
01.5K0
DreamTalk:使用一张头像图片即可生成表情丰富的说话视频

DreamTalk:1枚のアバター画像で表情豊かなトーキングビデオを生成!

DreamTalk総合紹介 DreamTalkは清華大学、アリババグループ、華中科技大学が共同開発した拡散モデル駆動型表情トーキングヘッド生成フレームワークです。主に、ノイズ除去ネットワーク、スタイル認識リップエキスパート、スタイル予測器の3つの部分から構成されており、ノイズ除去ネットワーク、スタイル認識リップエキスパート、スタイル予測器は、...
6ヶ月前
01.4K0
NarratoAI:文本生成影视解说与自动化剪辑神器

NarratoAI:テキスト生成映画・TVナレーション・自動編集ツール

概論 NarratoAIは、映画やビデオのナレーション、自動編集、吹き替え、字幕生成を統合した完全自動化ツールです。大規模言語モデリング(LLM)技術により、コピーを自動生成し、対応するナレーションと字幕をビデオに自動編集し、ユーザーにワンストップを提供します。
9ヶ月前
01.4K0
AI Hedge Fund:开源自动化交易系统,利用多智能体进行复杂对冲基金交易决策

AIヘッジファンド:複雑なヘッジファンド取引の意思決定に複数の知性を利用するオープンソースの自動取引システム

一般的な紹介 AIヘッジファンドは、マルチ・エージェント・システムを利用して取引の意思決定を行う人工知能ヘッジファンドである。このシステムは、マーケット・データ・エージェント、クオンツ・エージェント、リスク管理エージェント、ポートフォリオ管理エージェントなど、複数の専門エージェントと連携し、複雑な取引を実現する。
4ヶ月前
01.4K0
Excalidraw:手绘风格的虚拟白板工具|AI驱动文字生成流程图|Excalidraw使用教程

Excalidraw:手描き風バーチャルホワイトボードツール|AIによるテキスト生成フローチャート|Excalidrawチュートリアル

Excalidraw 概要 Excalidrawは、手描き風の図を簡単に描くことができるオープンソースの仮想ホワイトボード描画ツールです。Excalidrawを使って、手描き風の美しいイラストやワイヤーフレーム図など、お気に入りの図を作成することができます。
7ヶ月前
01.4K0
WrenAI:对话式数据分析AI助手,直接获取答案、SQL查询与分析报表

WrenAI: 回答、SQLクエリ、分析レポートに直接アクセスできる会話型データ分析AIアシスタント

概要 WrenAIは、データチーム、製品チーム、ビジネスチームが自然言語での会話を通じてデータの洞察を得ることを支援するために特別に設計されたオープンソースのSQL AIアシスタントです。自然言語をSQLクエリに変換し、チャート、スプレッドシート、レポートを生成し、多言語をサポートします。
5ヶ月前
01.4K0
ChatTTS:模仿真人说话声音的语音生成模型(ChatTTS一键加速包)

ChatTTS:実際の人の話し声を模倣した音声生成モデル(ChatTTSワンクリックアクセラレーションパッケージ)

一般的な紹介 ChatTTSは対話シナリオ用に設計された生成音声モデルです。自然で表現力豊かな音声を生成し、多言語、複数話者をサポートし、対話型ダイアログに適しています。このモデルは、笑い、ポーズ、間投詞のようなきめ細かなリズムの特徴を予測し、制御することで、対話に適した音声を生成します。
4ヶ月前
01.4K0
Novel:模仿Notion AI的开源写作编辑器

小説:Notion AIを模倣したオープンソースのライティング・エディター

包括的な紹介 これは、Steven Teyによって開発されたオープンソースプロジェクトで、Novelと呼ばれ、NotionスタイルのWYSIWYGテキストエディタであり、ユーザーがテキスト入力の効率を向上させることができる統合されたAIの自動補完機能です。このプロジェクトは、詳細なドキュメントとインストール手順を提供します。
10ヶ月前
01.4K0
Easy-Wav2Lip:高质量视频唇同步的工具,优化版Wav2Lip

Easy-Wav2Lip: Wav2Lipに最適化された高品質ビデオリップ同期ツール

はじめに Easy-Wav2LipはWav2Lipをベースに改良されたツールで、ビデオのリップシンクのプロセスを簡素化するように設計されています。このツールは、Google Colabとローカルインストールをサポートし、よりシンプルなセットアップと実装を提供します。アルゴリズムを最適化することで、Ea...
6ヶ月前
01.4K0
WebPilot:智能网页信息处理工具,网页内容抓取免费API

WebPilot:インテリジェントなウェブ情報処理ツール、ウェブコンテンツ取得のための無料API

WebPilot 概要 Webpilotはフリーでオープンソースの "ウェブアシスタント "です。ページを切り替えたり、コピー&ペーストする必要はなく、テキストを選択したり、コマンドを入力するだけで、ウェブパイロット...
9ヶ月前
01.4K0
MMAudio:为视频画面生成同步音效与配乐,视频到音频的多模态联合训练工具

MMAudio:ビデオ映像に同期した効果音やサウンドトラックを生成する、ビデオと音声のマルチモーダル共同トレーニングツール

综合介绍 MMAudio是一个开源项目,旨在通过多模态联合训练生成高质量的同步音频。该项目由香港中文大学的程浩基(Ho Kei Cheng)等人开发,主要功能是根据视频和/或文本输入生成同步音频。MM...
6ヶ月前
01.4K0
Leffa:高保真模特虚拟试穿与人物姿势调整,Meta开源的可控人物图像生成模型

Leffa:高忠実度モデルのバーチャル試着とキャラクターポーズ調整、メタ・オープンソース制御キャラクター画像生成モデル

包括的な紹介 Leffaは、制御可能なキャラクター画像を生成するための統一されたフレームワークであり、キャラクターの外見(バーチャルフィッティングなど)やポーズ(ポーズ転送など)の精密な操作を可能にする。このフレームワークは、ターゲットクエリをアテンション層の正しい参照キーにフォーカスさせることで、細かいディテールの歪みを大幅に低減する。
6ヶ月前
01.4K0
DeOldify:使用AI技术为黑白照片和视频上色的经典开源工具

DeOldify:モノクロ写真やビデオをAI技術でカラー化する定番のオープンソースツール

包括的な紹介 DeOldifyは、白黒写真やビデオのインテリジェントな着色と復元に特化した、ディープラーニング技術に基づくオープンソースプロジェクトです。このプロジェクトは、革新的なNoGAN学習方法を用いて、画像の着色プロセスにおける従来のGANネットワークの一般的な欠点を解決することに成功しています...
6ヶ月前
01.4K0