TangoFlux:30秒の長い音声を3秒で生成する高速テキスト-ダビング変換ツール!综合介绍 TangoFlux 是一个由 DeCLaRe Lab 开发的高效文本到音频(TTA)生成模型。该模型能够在短短 3.7 秒内生成长达 30 秒的 44.1kHz 立体声音频。TangoFlu...最新のAIツール# AI Java オープンソースプロジェクト# AIミュージック7ヶ月前01.7K
GFPGAN:テンセントのオープンソース顔修復アルゴリズム综合介绍 GFPGAN(Generative Facial Prior GAN)是由腾讯ARC(Applied Research Center)开发的一种开源人脸修复算法。该算法利用预训练的面部GAN...最新のAIツール# AI 画像の拡大と復元# AI Java オープンソースプロジェクト10ヶ月前01.7K
GOT-OCR2.0: QWen2 0.5Bエンドツーエンド・マルチモーダルOCRモデルに基づく综合介绍 GOT-OCR2.0是一个阶跃星辰联合推出de 开源光学字符识别(OCR)模型,旨在通过一个统一的端到端模型推动OCR技术向OCR-2.0迈进。该模型支持多种OCR任务,包括普通文本识别、格...最新のAIツール# AI Java オープンソースプロジェクト# OCR10ヶ月前01.7K
OpenWebUI-Monitor:OpenWebUIのユーザーアクティビティを監視し、使用量の制限を管理し、ワンクリックのデプロイをサポートします。概要 OpenWebUI-Monitorは、OpenWebUIユーザーのアクティビティを監視し、使用クォータを管理するためのダッシュボードです。ユーザークォータを効率的に設定し、ユーザデータと視覚的な情報をリアルタイムで表示することができ、ワンクリックのデプロイをサポートし、ユーザ管理と監視を容易にします。最新のAIツール# AI副業お金儲けプロジェクト# AI Java オープンソースプロジェクト8ヶ月前01.7K
DeOldify:モノクロ写真やビデオをAI技術でカラー化する定番のオープンソースツール包括的な紹介 DeOldifyは、白黒写真やビデオのインテリジェントな着色と復元に特化した、ディープラーニング技術に基づくオープンソースプロジェクトです。このプロジェクトは、革新的なNoGAN学習方法を用いて、画像の着色プロセスにおける従来のGANネットワークの一般的な欠点を解決することに成功しています...最新のAIツール# AI 画像の拡大と復元# AIイメージスタイルコントロール# AI Java オープンソースプロジェクト7ヶ月前01.7K
VSR:AI技術によるロスレスビデオ透かし除去及びハード字幕ソフトウェア(ビデオ透かし除去クライアント7G+)综合介绍 视频字幕去除工具(Video-subtitle-remover,简称VSR)是一款基于AI技术的视频处理软件,专门用于去除视频中的硬字幕和文本水印。该工具采用了多种AI算法模型(STTN、L...最新のAIツール# AI Java オープンソースプロジェクト# AIオーディオ/ビデオ・エディター6ヶ月前01.7K
Insanely Fast Whisper: 高速で効率的な音声テキスト化オープンソースプロジェクト包括的な紹介 insanely-fast-whisperは、OpenAIのWhisperモデルと様々な最適化技術(Transformers、Optimum、Flash Attentionなど)を組み合わせた音声転送です...最新のAIツール# AI Java オープンソースプロジェクト# AI音声合成6ヶ月前01.7K
OpenBB: プライベートデータとAIを統合し、投資の意思決定を強化するオープンソースの金融データ分析プラットフォーム概要 OpenBBは、すべての人に金融データと分析ツールへの簡単なアクセスを提供するために設計された、無料で完全にオープンソースの金融データ分析プラットフォームです。このプラットフォームは、株式、オプション、暗号通貨、外国為替、マクロ経済指標、固定...をカバーする100以上の異なるデータソースを統合しています。最新のAIツール# AI Java オープンソースプロジェクト# AI 金融データ分析6ヶ月前01.6K
Tencent Hybrid 3D(Hunyuan3D):高解像度3Dアセットの生成、複数の3Dマテリアル生成ワークフロー包括的な紹介 Tencent Hunyuan3D (Hunyuan3D 2.0)は、高解像度のテクスチャ3Dアセットを生成するために設計されたTencentの高度な大規模3D合成システムです。Hunyuan3D-DiTは大規模な形状生成モデルで、Hunyuan3D-DiTは大規模なテクスチャ生成モデルです。最新のAIツール# AI Java オープンソースプロジェクト# AIテキストとイメージを3Dへ6ヶ月前01.6K
AsrTools:音声字幕ツール、Cutscene、Racer、Must-Cutへのインターフェースを内蔵した軽量クライアント包括的な紹介 AsrToolsはCutscene、Racer、Must Cutなどの大手メーカーのインタフェースを内蔵したインテリジェントな音声テキスト変換ツールです。PyQt5をベースに開発されており、美しくユーザーフレンドリーなインターフェイスで、SRTやTXT形式の単語を出力することができます。最新のAIツール# AI Java オープンソースプロジェクト# AI音声合成9ヶ月前01.6K
WeChat動画番号ダウンローダー:WeChat動画番号の動画を素早くダウンロード、複数のフォーマットとプラットフォームをサポートする综合介绍 微信视频号下载器是一个开源项目,旨在帮助用户快速下载微信视频号中的视频内容。该工具支持多种视频格式和平台,用户可以方便地在Windows和macOS系统上使用。项目由ltaoo开发,并托管在...最新のAIツール# AI Java オープンソースプロジェクト6ヶ月前01.6K
DeepClaude:DeepSeekのR1チェーン推論とClaudeの創造性を融合したチャットインターフェース包括的な紹介 DeepClaudeは、DeepSeek R1の連鎖推論(CoT)機能とAnthropic Claudeモデルの創造性とコード生成を統合した、高性能な大規模言語モデル(LLM)推論APIとチャット・インターフェースです...最新のAIツール# AI Java オープンソースプロジェクト# AIローカライズチャットアプリケーション6ヶ月前01.6K
小説:Notion AIを模倣したオープンソースのライティング・エディター包括的な紹介 これは、Steven Teyによって開発されたオープンソースプロジェクトで、Novelと呼ばれ、NotionスタイルのWYSIWYGテキストエディタであり、ユーザーがテキスト入力の効率を向上させることができる統合されたAIの自動補完機能です。このプロジェクトは、詳細なドキュメントとインストール手順を提供します。最新のAIツール# AIライティング# AI Java オープンソースプロジェクト12个月前01.6K
ALog:音声読み上げ機能付きの携帯型AI音声日記アプリ。一般的な紹介 ALogはAIベースの音声日記アプリケーションで、ユーザーが音声で日常生活を記録できるように設計されています。duxinsによって開発され、GitHubでオープンソース化されている。ユーザーは音声入力で日記を記録することができ、アプリは自動的に音声をテキストに変換します...最新のAIツール# AI Java オープンソースプロジェクト# AI音声合成6ヶ月前01.6K
クローンボイス:Windows用のxtts_v2をベースにした多言語、サンプルレス音声クローンツール。一般的な説明 Clone Voiceはオープンソースのサウンドクローニングツールで、ウェブベースのインターフェイスを提供し、ユーザーが任意のサウンドや個人的な声の録音を使用して声のクローンを作成することができます。このツールは、NVIDIA GPUがなくても簡単に使用でき、コンパイル済みのアプリで使用できます。最新のAIツール# AI Java オープンソースプロジェクト# AIボイスクローニング10ヶ月前01.6K
MoneyPrinter V2:短いYouTube動画とTwitterコンテンツを自動生成し、公開する一般的な紹介 MoneyPrinter V2はFujiwaraChokiによって開発されたオープンソースプロジェクトで、自動化によってユーザーがオンラインでお金を稼ぐのを助ける。このプロジェクトは主にTwitter自動化、YouTubeショートビデオ生成、アフィリエイトキャンプを統合しています。最新のAIツール# AI副業お金儲けプロジェクト# AI Java オープンソースプロジェクト# AIマーケティング6ヶ月前01.6K
Datalab:専用のOCR認識AIモデル、PDF to Markdown(オープンソース/API)综合介绍 Datalab 提供了一系列先进的AI模型,专注于OCR、布局分析、PDF转Markdown等功能。这些模型不仅性能卓越,而且易于使用,并且是开源的。平台上的Marker模型可以快速准确地将...最新のAIツール# AIオープンサービス# AI Java オープンソースプロジェクト# OCR9ヶ月前01.6K
Leffa:高忠実度モデルのバーチャル試着とキャラクターポーズ調整、メタ・オープンソース制御キャラクター画像生成モデル包括的な紹介 Leffaは、制御可能なキャラクター画像を生成するための統一されたフレームワークであり、キャラクターの外見(バーチャルフィッティングなど)やポーズ(ポーズ転送など)の精密な操作を可能にする。このフレームワークは、ターゲットクエリをアテンション層の正しい参照キーにフォーカスさせることで、細かいディテールの歪みを大幅に低減する。最新のAIツール# AIイメージスタイルコントロール# AI Java オープンソースプロジェクト# AI フェイススワップとドレスアップ7ヶ月前01.6K
クールクライン:クラインのインテリジェント・コーディング・アシスタントの改良版で、クラインルー・クラインとバオ・クラインの利点を組み合わせたもの。一般的な説明 CoolClineは、Cline、Roo Cline、Bao Clineの最高の機能を組み合わせた強力なコーディングアシスタントです。コマンドラインインターフェイス(CLI)やエディタとシームレスに動作し、最もパワフルな...最新のAIツール# AI Java オープンソースプロジェクト# AIプログラミング7ヶ月前01.6K