AI开源项目 - 第38页

順番に並べる

ポスト更新目を通すクドス

SHMT: Self-Supervised Hierarchical Makeup Transfer Model, バーチャルメイク, 新しいポートレートへのメイクの移行

综合介绍 SHMT（Self-supervised Hierarchical Makeup Transfer）是一个基于潜在扩散模型的自我监督分层化妆迁移项目，旨在通过无监督学习方法实现化妆效果的高质...

5ヶ月前

01.1K

VITA: リアルタイム視覚・音声インタラクションのためのオープンソース・マルチモーダル大規模言語モデル

综合介绍 VITA是一个领先的开源交互式多模态大语言模型项目，率先实现了真正的全方位多模态交互能力。该项目于2024年8月推出VITA-1.0版本，开创了首个开源交互式全模态大语言模型的先河。2024...

5ヶ月前

01.3K

CrisperWhisper：正確な逐語音声書き起こしツール

概要 CrisperWhisperは、OpenAI Whisperをベースとした、高速で正確な単語単位の音声書き起こしに特化した高度な音声認識ツールです。スピーチのフィルやポーズがあっても、正確な単語レベルのタイムスタンプを提供します。

5ヶ月前

01.6K

AIの自作組：AIによる映像の多言語字幕の自動生成と翻訳

概論 AIの字幕組は、動画字幕の自動抽出、自動文字起こし、自動翻訳を可能にする、強力なコマンドライン動画字幕処理ツールです。このツールには、ウィスパー音声を含む高度なAI技術が統合されています。

5ヶ月前

01.1K

TransRouter：Geminiマルチモーダルモデルに基づく中英翻訳用リアルタイム音声変換ツール

综合介绍 TransRouter 是一个基于 Google Gemini 大模型的实时语音翻译工具，专门设计用于实现中英文之间的实时语音互译。该工具能够无缝集成到 Zoom 等视频会议软件中，为跨语言...

5ヶ月前

01K

opensource_notebooklm：基于Deepseek-V3和PlayHT TTS的NotebookLM开源实现

opensource_notebooklm: Deepseek-V3とPlayHT TTSに基づくNotebookLMのオープンソース実装

概論オープンソースNotebookLMは、Deepseek-V3の言語理解能力とPlayHTの音声合成技術を組み合わせた革新的な人工知能プロジェクトであり、インテリジェントなノート作成対話システムを目指しています。このプロジェクトは、Build Fast社によって開発されました。

5ヶ月前

01.4K

Diffbot GraphRAG LLM：依赖外部实时知识图谱数据的LLM推理服务

Diffbot GraphRAG LLM: 外部リアルタイム知識グラフデータに依存するLLM推論サービス

包括的な紹介 Diffbot LLM Reasoning Server は LLama モデルアーキテクチャに基づいた特別な最適化と改良が施された革新的な大規模言語モデリングシステムです。このプロジェクトの最も重要な特徴は、リアルタイムナレッジグラフと検索を強化した生成の統合です...

5ヶ月前

01.3K

JupyterLab Magic Wand：在JupyterLab中使用AI助手提升工作效率

JupyterLab Magic Wand: JupyterLabでAIアシスタントを使って生産性を高める

综合介绍 JupyterLab Magic Wand是一个实验性的JupyterLab扩展，旨在为JupyterLab笔记本提供内嵌的AI助手功能。该扩展由Zsailer开发，主要用于提升数据科学家和...

最新のAIツール # AI Java オープンソースプロジェクト

5ヶ月前

0992

LuminaBrush：スマートペイントツールで画像にイルミネーションを加える

はじめに LuminaBrushは、人工知能技術を搭載した、照明効果のための革新的なインタラクティブ画像編集ツールです。このプロジェクトでは、2段階のフレームワークを使用して画像を処理します。第1段階では、入力画像を「均一な照明」ルックに変換し、第2段階では、...

5ヶ月前

01.8K

Groq AppGen：使用Groq API展示Llama 3.3 70B HTML代码生成能力的实验项目

Groq AppGen: Groq APIを使用したLlama 3.3 70B HTMLコード生成機能の実証実験プロジェクト

综合介绍 Groq AppGen 是一个创新的交互式网页应用生成器，由 Groq 公司开发并开源。该项目展示了 Llama 3.3 70B 模型在 HTML 代码生成方面的强大能力。通过集成 Groq...

最新のAIツール # AI Java オープンソースプロジェクト

5ヶ月前

01.1K

llms.txt Generator：快速抓取网站内容并，生成LLM训练文本数据集

llms.txt Generator: Webサイトのコンテンツを素早くキャプチャし、LLMトレーニング用テキストデータセットを生成します。

综合介绍 llmstxt-generator 是一个专业的网站内容提取和整合工具，专门为大语言模型(LLM)的训练和推理准备高质量文本数据集。该工具由 Mendable AI 开发，采用 @firec...

5ヶ月前

01.3K

Raycast-G4F：通过Raycast免费使用GPT-4、Llama-3等多种 AI 模型

Raycast-G4F: Raycastを通じてGPT-4、Llama-3、その他多くのAIモデルに無料でアクセスできます！

概論 Raycast-G4F（GPT4Free）は、GPT-4、Llama-3を含む幅広い先進的なAIモデルに無料でアクセスできる強力なRaycast拡張機能です。この拡張機能は、リアルタイムのダイアログストリーミングを提供するだけでなく...

5ヶ月前

01.2K

Gemini Search：Gemini 2.0 Flash构建的 Perplexity 风格 AI 搜索引擎

Gemini Search: Gemini 2.0 Flashで構築されたPerplexityスタイルのAI検索エンジン

综合介绍 Gemini-Search 是一个基于 Google Gemini 2.0 技术打造的开源智能搜索引擎项目。该项目采用 TypeScript 开发，致力于复制 Perplexity 搜索引擎...

5ヶ月前

01.2K

Devin.cursorrules：增强Cursor IDE开发体验，将Cursor/Windsurf打造成类Devin智能编程助手

Devin.cursorrules：カーソルIDE開発体験の向上、Cursor/WindsurfをDevinライクなインテリジェント・プログラミング・アシスタントに

概要 Devin.cursorrulesは、手頃な価格のCursorまたはWindsurf IDE（～20ドル）をDevinのような強力なAIプログラミング・アシスタントに変換するために設計された革新的なオープンソース・プロジェクトです。このプロジェクトは、CursorまたはWindsurf IDE（～20ドル）をDevinのような強力なAIプログラミング・アシスタントに変換するために設計されています。

5ヶ月前

01.4K

1つのハブ：OpenAIインターフェースの管理と配布、複数のモデルと統計機能のサポート

综合介绍 One Hub 是一个基于 One API 二次开发的 OpenAI 接口管理和分发系统。该项目由 MartialBE 开发，旨在提供更广泛的模型支持和更完善的统计功能。One Hub 具有...

最新のAIツール # AI Java オープンソースプロジェクト

6ヶ月前

0974

Fish Agent：端到端AI语音克隆助手，实时语音对话助理，Fish Speech衍生项目

フィッシュ・エージェント：エンド・ツー・エンドのAIボイス・クローン・アシスタント、リアルタイム音声対話アシスタント、フィッシュ・スピーチ・スピンオフ・プロジェクト

包括的な紹介フィッシュ・スピーチ派生プロジェクトフィッシュ・エージェントは、V0.1 3Bモデル・アーキテクチャに基づいて開発された、革命的なエンド・ツー・エンドのAIスピーチ・クローン・システムです。完全なエンド・ツー・エンドの音声クローン処理システムとして、その最大の特徴は、革新的なスピーチレス...

6ヶ月前

01.1K

Story-Adapter：長いストーリーに基づき、連続的で一貫性のあるグラフィック・イラストレーションを生成します。

概論 Story-Adapterは、テキストストーリーを首尾一貫した画像シーケンスに変換する革新的なストーリー視覚化フレームワークである。研究者によって開発されたこのプロジェクトは、高品質のストーリーイラストを生成するためのトレーニングが不要な反復アプローチを採用している。このフレームワークの特徴は、長いストーリーを扱えることである。

6ヶ月前

01.3K

XiaohongshuのAI操作アシスタント：自動的にXiaohongshuの記事を生成し、公開します。

総合紹介 Xiaohongshu AI Operation Assistant（xhsaipublisher）は、Xiaohongshuプラットフォームで記事を公開するために設計された自動化ツールです。このプロジェクトは、グラフィカル・ユーザー・インターフェースと自動化スクリプトを組み合わせ、ビッグモデル技術を使ってコンテンツを生成し、ブラウザ経由で自動的にログインして公開します...

6ヶ月前

01.3K

FunClip：ビデオコンテンツをショートフィルムにインテリジェントに編集。

総合紹介 FunClipは、アリババ達磨研究所のTONGYI Speech Labによって開発された、完全オープンソースのローカライズされた自動ビデオ編集ツールです。このツールは、産業グレードのParaformer-Large音声認識モデルを統合し、ビデオ内の音声を正確に識別することができます...

6ヶ月前

01.1K

AIオープンソースプロジェクト