SHMT: Self-Supervised Hierarchical Makeup Transfer Model, バーチャルメイク, 新しいポートレートへのメイクの移行综合介绍 SHMT(Self-supervised Hierarchical Makeup Transfer)是一个基于潜在扩散模型的自我监督分层化妆迁移项目,旨在通过无监督学习方法实现化妆效果的高质...最新のAIツール# AI Java オープンソースプロジェクト# AI フェイススワップとドレスアップ5ヶ月前01.1K
VITA: リアルタイム視覚・音声インタラクションのためのオープンソース・マルチモーダル大規模言語モデル综合介绍 VITA是一个领先的开源交互式多模态大语言模型项目,率先实现了真正的全方位多模态交互能力。该项目于2024年8月推出VITA-1.0版本,开创了首个开源交互式全模态大语言模型的先河。2024...最新のAIツール# AI Java オープンソースプロジェクト# マルチモーダルなリアルタイム・インタラクティブ製品5ヶ月前01.3K
CrisperWhisper:正確な逐語音声書き起こしツール概要 CrisperWhisperは、OpenAI Whisperをベースとした、高速で正確な単語単位の音声書き起こしに特化した高度な音声認識ツールです。スピーチのフィルやポーズがあっても、正確な単語レベルのタイムスタンプを提供します。最新のAIツール# AI Java オープンソースプロジェクト# AI音声合成5ヶ月前01.6K
AIの自作組:AIによる映像の多言語字幕の自動生成と翻訳概論 AIの字幕組は、動画字幕の自動抽出、自動文字起こし、自動翻訳を可能にする、強力なコマンドライン動画字幕処理ツールです。このツールには、ウィスパー音声を含む高度なAI技術が統合されています。最新のAIツール# AI Java オープンソースプロジェクト# AI翻訳# AI音声合成5ヶ月前01.1K
TransRouter:Geminiマルチモーダルモデルに基づく中英翻訳用リアルタイム音声変換ツール综合介绍 TransRouter 是一个基于 Google Gemini 大模型的实时语音翻译工具,专门设计用于实现中英文之间的实时语音互译。该工具能够无缝集成到 Zoom 等视频会议软件中,为跨语言...最新のAIツール# AI Java オープンソースプロジェクト# マルチモーダルなリアルタイム・インタラクティブ製品5ヶ月前01K
opensource_notebooklm: Deepseek-V3とPlayHT TTSに基づくNotebookLMのオープンソース実装概論 オープンソースNotebookLMは、Deepseek-V3の言語理解能力とPlayHTの音声合成技術を組み合わせた革新的な人工知能プロジェクトであり、インテリジェントなノート作成対話システムを目指しています。このプロジェクトは、Build Fast社によって開発されました。最新のAIツール# AI Java オープンソースプロジェクト# AIテキストおよび音声/ビデオ要約ツール5ヶ月前01.4K
Diffbot GraphRAG LLM: 外部リアルタイム知識グラフデータに依存するLLM推論サービス包括的な紹介 Diffbot LLM Reasoning Server は LLama モデルアーキテクチャに基づいた特別な最適化と改良が施された革新的な大規模言語モデリングシステムです。このプロジェクトの最も重要な特徴は、リアルタイムナレッジグラフと検索を強化した生成の統合です...最新のAIツール# AI Java オープンソースプロジェクト#ナレッジグラフ# 知識検索とRAGフレームワーク5ヶ月前01.3K
JupyterLab Magic Wand: JupyterLabでAIアシスタントを使って生産性を高める综合介绍 JupyterLab Magic Wand是一个实验性的JupyterLab扩展,旨在为JupyterLab笔记本提供内嵌的AI助手功能。该扩展由Zsailer开发,主要用于提升数据科学家和...最新のAIツール# AI Java オープンソースプロジェクト5ヶ月前0992
LuminaBrush:スマートペイントツールで画像にイルミネーションを加えるはじめに LuminaBrushは、人工知能技術を搭載した、照明効果のための革新的なインタラクティブ画像編集ツールです。このプロジェクトでは、2段階のフレームワークを使用して画像を処理します。第1段階では、入力画像を「均一な照明」ルックに変換し、第2段階では、...最新のAIツール# AIイメージスタイルコントロール# AI Java オープンソースプロジェクト5ヶ月前01.8K
Groq AppGen: Groq APIを使用したLlama 3.3 70B HTMLコード生成機能の実証実験プロジェクト综合介绍 Groq AppGen 是一个创新的交互式网页应用生成器,由 Groq 公司开发并开源。该项目展示了 Llama 3.3 70B 模型在 HTML 代码生成方面的强大能力。通过集成 Groq...最新のAIツール# AI Java オープンソースプロジェクト5ヶ月前01.1K
llms.txt Generator: Webサイトのコンテンツを素早くキャプチャし、LLMトレーニング用テキストデータセットを生成します。综合介绍 llmstxt-generator 是一个专业的网站内容提取和整合工具,专门为大语言模型(LLM)的训练和推理准备高质量文本数据集。该工具由 Mendable AI 开发,采用 @firec...最新のAIツール# AI Java オープンソースプロジェクト# ドキュメントの抽出とクリーニング5ヶ月前01.3K
Raycast-G4F: Raycastを通じてGPT-4、Llama-3、その他多くのAIモデルに無料でアクセスできます!概論 Raycast-G4F(GPT4Free)は、GPT-4、Llama-3を含む幅広い先進的なAIモデルに無料でアクセスできる強力なRaycast拡張機能です。この拡張機能は、リアルタイムのダイアログストリーミングを提供するだけでなく...最新のAIツール# AI Java オープンソースプロジェクト# AIローカライズチャットアプリケーション# Free Large Model API5ヶ月前01.2K
Gemini Search: Gemini 2.0 Flashで構築されたPerplexityスタイルのAI検索エンジン综合介绍 Gemini-Search 是一个基于 Google Gemini 2.0 技术打造的开源智能搜索引擎项目。该项目采用 TypeScript 开发,致力于复制 Perplexity 搜索引擎...最新のAIツール# AI Java オープンソースプロジェクト# AI検索ツール5ヶ月前01.2K
Devin.cursorrules:カーソルIDE開発体験の向上、Cursor/WindsurfをDevinライクなインテリジェント・プログラミング・アシスタントに概要 Devin.cursorrulesは、手頃な価格のCursorまたはWindsurf IDE(~20ドル)をDevinのような強力なAIプログラミング・アシスタントに変換するために設計された革新的なオープンソース・プロジェクトです。このプロジェクトは、CursorまたはWindsurf IDE(~20ドル)をDevinのような強力なAIプログラミング・アシスタントに変換するために設計されています。最新のAIツール# AI Java オープンソースプロジェクト# AIプログラミング5ヶ月前01.4K
1つのハブ:OpenAIインターフェースの管理と配布、複数のモデルと統計機能のサポート综合介绍 One Hub 是一个基于 One API 二次开发的 OpenAI 接口管理和分发系统。该项目由 MartialBE 开发,旨在提供更广泛的模型支持和更完善的统计功能。One Hub 具有...最新のAIツール# AI Java オープンソースプロジェクト6ヶ月前0974
フィッシュ・エージェント:エンド・ツー・エンドのAIボイス・クローン・アシスタント、リアルタイム音声対話アシスタント、フィッシュ・スピーチ・スピンオフ・プロジェクト包括的な紹介 フィッシュ・スピーチ派生プロジェクト フィッシュ・エージェントは、V0.1 3Bモデル・アーキテクチャに基づいて開発された、革命的なエンド・ツー・エンドのAIスピーチ・クローン・システムです。完全なエンド・ツー・エンドの音声クローン処理システムとして、その最大の特徴は、革新的なスピーチレス...最新のAIツール# AI Java オープンソースプロジェクト# AIボイスクローニング# マルチモーダルなリアルタイム・インタラクティブ製品6ヶ月前01.1K
Story-Adapter:長いストーリーに基づき、連続的で一貫性のあるグラフィック・イラストレーションを生成します。概論 Story-Adapterは、テキストストーリーを首尾一貫した画像シーケンスに変換する革新的なストーリー視覚化フレームワークである。研究者によって開発されたこのプロジェクトは、高品質のストーリーイラストを生成するためのトレーニングが不要な反復アプローチを採用している。このフレームワークの特徴は、長いストーリーを扱えることである。最新のAIツール# AIイメージスタイルコントロール# AI Java オープンソースプロジェクト6ヶ月前01.3K
XiaohongshuのAI操作アシスタント:自動的にXiaohongshuの記事を生成し、公開します。総合紹介 Xiaohongshu AI Operation Assistant(xhsaipublisher)は、Xiaohongshuプラットフォームで記事を公開するために設計された自動化ツールです。このプロジェクトは、グラフィカル・ユーザー・インターフェースと自動化スクリプトを組み合わせ、ビッグモデル技術を使ってコンテンツを生成し、ブラウザ経由で自動的にログインして公開します...最新のAIツール# AI副業お金儲けプロジェクト# AI Java オープンソースプロジェクト6ヶ月前01.3K
FunClip:ビデオコンテンツをショートフィルムにインテリジェントに編集。総合紹介 FunClipは、アリババ達磨研究所のTONGYI Speech Labによって開発された、完全オープンソースのローカライズされた自動ビデオ編集ツールです。このツールは、産業グレードのParaformer-Large音声認識モデルを統合し、ビデオ内の音声を正確に識別することができます...最新のAIツール# AI Java オープンソースプロジェクト# AI音声合成# AIオーディオ/ビデオ・エディター6ヶ月前01.1K