CodeFormer:图像与视频面部复原,老照片修复,提供一键部署版

CodeFormer: 画像とビデオの顔復元、古い写真の復元、ワンクリック展開版を提供

CodeFormer 概要 CodeFormerは、南洋理工大学S-Labの研究チームによって開発され、NeurIPS 2022で発表された、頑健なブラインド顔修正のためのコードベースである。このプロジェクトでは、Codebook Lookup Transformer (C...
8ヶ月前
01.5K0
Fish Speech:快速且高精度使用少样本克隆中英文语音

フィッシュ・スピーチ:少ないサンプル数で中国語と英語の音声を高速かつ高精度にクローニング

概要 フィッシュ・スピーチはフィッシュ・オーディオが開発したオープンソースの音声合成ツールです。このツールはVQ-GAN、Llama、VITSなどの最先端のAI技術に基づいており、テキストをリアルな音声に変換することができます。
4ヶ月前
01.5K0
OpenVoice(MyShell):多语言少样本即时语音克隆

OpenVoice (MyShell):少ないサンプルで多言語の音声クローニングが可能

概論 OpenVoiceは、リファレンススピーカーの音声をコピーし、スピーカーの短いオーディオクリップのみを使用して多言語音声を生成することができる、インスタントスピーチクローニングの多用途な方法です。OpenVoiceでは、音色のコピーだけでなく、感情的な表現など、声のスタイルを細かくコントロールすることができます。
7ヶ月前
01.5K0
DDG-Chat:一键部署Chat2API后端,DuckDuckGo转API

DDG-Chat:ワンクリックでChat2APIバックエンドをデプロイ、DuckDuckGoをAPIへ

一般的な紹介 DDG-Chat は、ワンクリックで複数のプラットフォームにデプロイできる ChatGPT API バックエンドを提供することを目的としたオープンソースプロジェクトです。このプロジェクトは、GPT-4o mini、Claude 3 Haiku、Llam...を含む複数のモデルをサポートしています。
7ヶ月前
01.5K0
VisoMaster:强大且易用的图片/视频换脸和编辑软件

VisoMaster: パワフルで使いやすい写真/ビデオ整形・編集ソフトウェア

はじめに VisoMasterは、人工知能技術を使用して自然でリアルなフェイススワップ効果を実現する、パワフルで使いやすいビデオフェイススワップ編集ツールです。画像でもビデオでも、VisoMasterは簡単な操作で高品質のフェイススワップ結果を生成することができ、一般的なビデオ編集に適しています。
4ヶ月前
01.5K0
SadTalker:让照片说话|嘴型同步音频|合成口型同步视频|免费数字人

SadTalker: 写真にしゃべらせる|口パク音声|合成口パク動画|無料デジタルピープル

概要 SadTalkerは、1枚の静止ポートレート写真と音声ファイルを組み合わせて、パーソナライズされたメッセージや教育コンテンツなど、幅広いシナリオに対応するリアルなトーキングアバター動画を作成するオープンソースツールです。ExpNetやPoseVAなどの3Dモデリング技術の革命的な使用...
4ヶ月前
01.5K0
AutoGen Studio:多代理系统AutoGen的简易用户界面版

AutoGen Studio:マルチエージェントシステムAutoGenの使いやすいインターフェイス版

概要 AutoGen Studio 2.0は、マルチエージェント・ソリューションの作成と管理のプロセスを簡素化するために設計されたAutoGenによるユーザー・インターフェースです。このプラットフォームでは、直感的なインターフェースを通じて、エージェントとそのワークフローを宣言的に定義および変更することができます...
4ヶ月前
01.5K0
Genesis:开源生成式物理引擎,实现基于真实物理的4D动态世界模拟

Genesis: 実物理ベースの4Dダイナミックワールドシミュレーションのためのオープンソース生成物理エンジン

综合介绍 Genesis 是一个为通用机器人和具身 AI 学习设计的生成性物理世界。它提供了一个统一的仿真平台,支持多种材料和物理现象的模拟。Genesis 旨在通过结合生成性 AI 和物理仿真,解锁...
6ヶ月前
01.5K0
GPT SoVITS:革命性的语音生成与语音克隆工具

GPT SoVITS:画期的な音声生成・音声クローニングツール

総合紹介 GPT-SoVITSは、GPTモデルとSoVITSボイスチェンジャー技術を組み合わせたオープンソースの音声変換・合成ツールです。このツールは、0サンプルや数サンプルでのオンザフライテキスト音声変換や、わずか5秒間の音声サンプルでの音声スタイル移行をサポートしています。このツールの特徴には、言語横断的な音声合成が含まれます。
9ヶ月前
01.5K0
MuseV+Muse Talk:完整数字人视频生成框架|人像转视频|姿态转视频|唇形同步

MuseV+Muse Talk:完全なデジタルヒューマンビデオ生成フレームワーク|ポートレートからビデオへ|ポーズからビデオへ|リップシンク

一般的な紹介 MuseVはGitHubで公開されているプロジェクトで、長さ無制限で忠実度の高いアバター動画生成を目的としています。拡散技術に基づいており、Image2Video、Text2Image2Video、Video2Video...を提供します。
6ヶ月前
01.5K0
ebook2audiobook:将电子书转换为有声读物,支持多语言和语音克隆的开源工具

ebook2audiobook: 電子書籍をオーディオブックに変換する、多言語サポートと音声クローンを持つオープンソースツール

一般的な紹介 ebook2audiobookは、強力なオープンソースの電子書籍からオーディオブックツールです。複数のフォーマットのeBookを、完全なチャプターマーカーとメタデータ付きのオーディオブックに変換することができます。このツールは、電子書籍フォーマットの変換にCo...
5ヶ月前
01.5K0
RD-Agent:自动化数据驱动研发工具,通过AI技术推动以数据为导向的研发过程

RD-Agent:AI技術によりデータ駆動型研究開発プロセスを促進する自動化されたデータ駆動型研究開発ツール

综合介绍 RD-Agent是由微软推出的一款开源工具,旨在自动化和优化研究与开发(R&D)过程。该工具专注于数据驱动的场景,通过人工智能技术提升模型和数据的开发效率。RD-Agent集成了研究...
3ヶ月前
01.5K0
MoneyPrinterPlus:一键生成短视频的AI工具,免费批量混剪

MoneyPrinterPlus:ワンクリックで短い動画を作成するAIツール、無料のバッチミキシング

総合紹介 MoneyPrinterPlusは、AI技術によって、ワンクリックであらゆる種類の短い動画を生成・ミックスし、Jieyin、Shutterbugs、Xiaohongshu、Video Numberなどの複数の動画プラットフォームに自動的に公開することを目的としたオープンソースプロジェクトです。このツールは、ローカルおよびクラウドベースの音声モデルをサポートしており、チャット...
9ヶ月前
01.5K0
ComfyUI Portrait Master 中文版:优化肖像生成的提示词工具

ComfyUI ポートレートマスター中国語版:似顔絵生成を最適化するキューワードツール

はじめに ComfyUI Portrait Master 中国語版は、AI画像クリエイターのために設計された似顔絵キューワード生成ツールです。このツールは、ユーザーがキューワードを最適化することによって、高品質の似顔絵を生成するのに役立ちます。ユーザーは、要求に応じて異なるレンズを選択することができます...
9ヶ月前
01.5K0
Coqui TTS(xTTS):文本到语音生成的深度学习工具包,支持多种语言和声音克隆功能

Coqui TTS (xTTS):多言語サポートと音声クローン機能を備えた音声合成用ディープラーニングツールキット

包括的な紹介 Coqui TTSは、ディープラーニング技術に基づくオープンソースの高度な音声合成(TTS)ツールキットです。Coqui TTSは、研究環境と実運用環境の両方でテストされており、多言語のテキスト音声変換をサポートする豊富な機能とモデルのセットを提供します。
4ヶ月前
01.5K0
LatentSync:用音频直接生成唇形同步视频的开源工具

LatentSync: 音声から直接リップシンクされたビデオを生成するオープンソースツール

概要 LatentSyncはByteDanceによって開発され、GitHubでホストされているオープンソースツールです。動画内のキャラクターの唇の動きを音声を通して直接駆動し、口の形が音声と正確に一致するようにします。このプロジェクトは、Stable Di...
2ヶ月前
01.5K0