Gemini Playground:无服务器部署Gemini多模态对话网站

Gemini Playground: Geminiマルチモーダル対話サイトのサーバーレス展開

一般的な紹介 Gemini Playgroundは、ユーザーが迅速にマルチモーダル対話サイトを展開するために設計されたオープンソースプロジェクトです。このプロジェクトは、技術的なクロールエビによって開発され、デプロイを完了するために10秒でGemini API Keyの使用をサポートしています。ユーザが...
4ヶ月前
06850
wdoc:从海量、多源文档中检索内容并总结知识

wdoc: 膨大なマルチソースドキュメントからコンテンツを取り出し、知識を要約する

包括的な紹介 wdocは、大量の多様な文書を処理・分析するために設計された強力なRAG(Retrieval Augmentation Generation)システムです。wdocはPDF、ウェブページ、YouTubeビデオ、オーディオファイルなど、様々な種類のドキュメントを検索することができます。
4ヶ月前
06430
Magic 1-For-1: 高效生成视频的开源项目,号称在一分钟内生成一分钟的视频

Magic 1-For-1:1分で1分の動画を生成すると謳う、効率的な動画生成オープンソースプロジェクト

包括的な紹介 Magic 1-For-1は、メモリ使用量を最適化し、推論の待ち時間を短縮するために設計された効率的なビデオ生成モデルである。このモデルは、テキストから動画への生成タスクを、テキストから画像への生成と画像から動画への生成という2つのサブタスクに分解し、より効率的な学習と蒸留を可能にする。
4ヶ月前
07880
DataLine:AI数据分析与可视化客户端,快速生成图表和报告

DataLine: 迅速なチャートとレポート作成のためのAIデータ分析・可視化クライアント

概要 DataLineは、様々なデータソースを簡単な操作で操作できるように設計された、強力なAIデータ分析・可視化ツールです。CSVファイルであろうと、Postgres、MySQL、Snowflake、SQL...といった主流のデータベースであろうと。
4ヶ月前
07290
FinRobot:提升金融数据分析效率和投资研究的的智能体

FinRobot:金融データ分析の効率化と投資リサーチを向上させる知的ボディ

包括的な紹介 FinRobotはAI4Finance Foundationによって開発されたオープンソースのAIインテリジェンス・プラットフォームであり、金融分析用に設計されている。従来の言語モデルをカバーするだけでなく、様々なAI技術を取り入れ、金融業界に包括的なソリューションを提供することを目指しています。
4ヶ月前
07890
Simba:收纳文档的知识管理系统,无缝集成到任何RAG系统

シンバ:文書整理のためのナレッジマネジメントシステムで、あらゆるRAGシステムにシームレスに統合されます。

概要 Simbaは、あらゆるRAG(Retrieval Augmentation Generation)システムとシームレスに統合できるように設計されたポータブルな知識管理システム(KMS)です。GitHubのユーザーGitHamza0206によって作成されたこのプロジェクトは、様々なナレッジマネジメントのための効率的なソリューションを提供します。
4ヶ月前
08190
LocalPdfChatRAG:支持本地多源PDF文档问答的智能聊天工具

LocalPdfChatRAG:マルチソースPDFドキュメントのローカルQ&Aをサポートするインテリジェントなチャットツール

包括的な紹介 LocalPdfChatRAGは、ローカルPDF文書とRAG(Retrieval Augmented Generation)モデルを組み合わせることで、インテリジェントなチャット機能を実装することを目的としたオープンソースプロジェクトです。このプロジェクトでは、ユーザがPDFドキュメントをアップロードし、自然言語を通じて質問することで、ドキュメントから相対的な...
4ヶ月前
06660
Deep Searcher:企业私有文档高效检索与智能问答

ディープサーチャー:企業の私文書の効率的な検索とインテリジェントなQ&A

概要 Deep Searcherは、強力なビッグ言語モデル(DeepSeekやOpenAIなど)と、プライベートデータに基づいて検索、評価、推論を行うように設計されたベクトルデータベース(Milvusなど)を組み合わせたツールで、精度の高い回答を提供する...
4ヶ月前
07960
Flashcard:基于Dify构建的单词闪卡外语学习工具,替代多邻国(Duolingo)

フラッシュカード:Duolingoに代わってDify上に構築された単語フラッシュカード外国語学習ツール

概要 Flashcardは、Duolingoに代わるオープンソースの言語学習ツールです。Steven Lynn (GitHub username: stvlynn) によって開発されたこのプロジェクトは、モダンなユーザーインターフェイスと多言語を特徴としています。
4ヶ月前
06680
Goku: 生成画面精细且一致的视频,适合创作包含人物、物体细节的广告视频

悟空:詳細で一貫性のある動画を生成します。詳細なキャラクターやオブジェクトを使用したコマーシャルの作成に最適です。

包括的な紹介 Gokuは、ストリーム変換技術に基づく連携型画像・動画生成モデルであり、業界トップクラスのパフォーマンスを達成するよう設計されています。Gokuは、きめ細かなデータ照合、モデル設計、ストリーム変換の定式化など、高度で高品質な映像生成技術を統合しています。
4ヶ月前
08530
Gemini Cursor:基于Gemini构建的AI桌面智能助手,能看、能听、能说

Gemini Cursor:見て、聞いて、話すことができるGemini上に構築されたAIデスクトップスマートアシスタント

概論 Gemini Cursorは、GoogleのGemini 2.0 Flash(実験的)モデルをベースとしたデスクトップ知的アシスタントである。Gemini Cursorは、マルチモーダルAPIを通じて、視覚、聴覚、音声によるインタラクションを可能にし、リアルタイムで低遅延な利用を提供します。
4ヶ月前
07920
Data Formulator:AI驱动的数据可视化工具

Data Formulator:AIによるデータ可視化ツール

概論 Data Formulator は Microsoft Research によって開発されたオープンソースのAI駆動型データ可視化ツールである。このツールは、グラフィカル・ユーザー・インターフェース (GUI) と自然言語入力 (NL) を組み合わせたもので、ユーザーは簡単なインタラクションやコマンドによって、素早くデータを作成し、反復することができます。
4ヶ月前
01.1K0
Ai2 OLMoE:基于 OLMoE 模型离线运行的开源iOS AI应用

Ai2 OLMoE:オフラインで動作するOLMoEモデルに基づくオープンソースのiOS AIアプリ

概要 Ai2 OLMoEは、Allen Institute for AI (Ai2, Allen Institute for Artificial Intelligence)によって開発されたオープンソースのiOSアプリで、デバイス上で動作するAIモデルを提供します。このアプリは、Ai2のオープンソースOLMoEを活用しています。
4ヶ月前
07570
Meetily:生成会议纪要的AI助手,实时转录和生成会议摘要

Meetily:会議議事録の作成、書き起こし、会議サマリーの作成をリアルタイムで行うAIアシスタント

一般的な説明 MeetilyはZackriya Solutionsによって開発されたAIを搭載した会議アシスタントで、会議の音声をリアルタイムでキャプチャし、音声書き起こしを行い、会議のサマリーを生成します。すべての処理がデバイス上でローカルに行われる点が特徴で、ユーザーのプライバシーを保証します。
4ヶ月前
01.1K0
DeepSeek-VL2:高级多模态理解的专家级视觉语言模型

DeepSeek-VL2:高度なマルチモーダル理解のためのエキスパート視覚言語モデル

包括的な紹介 DeepSeek-VL2は、その前身であるDeepSeek-VLの性能を大幅に向上させた、高度なMoE(Mixture-of-Experts)視覚言語モデルのシリーズです。このモデルは、視覚的な質問と回答、光学式文字認識、テキスト...
4ヶ月前
01.1K0
Zonos:高质量语音合成与语音克隆工具

Zonos: 高品質音声合成と音声クローニングツール

一般的な紹介 ZonosはZyphraによって開発されたオープンソースの音声合成と音声クローニングツールです。Zonos-v0.1バージョンは、高品質の音声出力を生成するために高度なトランスフォーマーとブレンドモデルを使用しています。このツールは複数の言語をサポートしています。
4ヶ月前
01.2K0
ChatGPT Box:让 ChatGPT 在其他网页工作的浏览器插件

ChatGPT Box: 他のウェブページでChatGPTを動作させるブラウザプラグイン

一般的な紹介 ChatGPT Boxは、ChatGPTをユーザーのブラウザに深く統合するために設計されたオープンソースのブラウザ拡張機能です。josStorerによって開発されたこのツールは、複数の言語をサポートし、任意のページ上でチャットペアを呼び出すなどの様々な機能を提供します...
2ヶ月前
08360