Open Deep Research:生成基于网络搜索内容的AI研究报告

オープン・ディープ・リサーチ:ウェブ検索コンテンツに基づくAI研究の生成

概論 Open Deep Researchは、Google Geminiのディープリサーチ機能に代わるオープンソースのAI駆動型リサーチレポート作成ツールである。プロジェクトはTypeScriptで開発されており、Next.js 1...をベースにしています。
2ヶ月前
01.3K0
GPT Academic:最佳Arxiv学术论文翻译、纠错与代码解释

GPTアカデミック:Arxiv学術論文翻訳、エラー訂正、コード解釈の最優秀賞

一般的な紹介 GPT Academicは、学術研究に最適化された大規模言語モデルのためのインタラクティブプラットフォームです。GPT/GLMのような大規模言語モデルへの実用的なインタラクティブインターフェースのためのツールを提供し、特に論文翻訳、論文読解、推敲、執筆の経験に最適化されています。モジュール設計を採用しています。
7ヶ月前
01.3K0
STORM:基于Topic搜索网络数据,生成带引用的论文、长文报告

STORM:トピックに基づくウェブデータの検索、引用文献を含む論文の生成、長い論文レポート

概論 STORMはスタンフォード大学のOvalチームによって開発された知識統合・記事生成システムである。ウィキペディアのような網羅的な記事(体系的な論文)をゼロから生成することに重点を置いている。このシステムは、トピックの調査、概要の作成、実際の相互接続のシミュレーションのために大規模な言語モデルを使用する。
2ヶ月前
01.3K0
NSFW Detector:检测文件是否包含不适(NSFW)内容,保护数据安全

NSFW Detector: ファイルにNSFWコンテンツが含まれているかどうかを検出し、データのセキュリティを保護します。

包括的な紹介 NSFW DetectorはAIベースの不快コンテンツ検出ツールで、主に画像、動画、PDFファイルなどに不快コンテンツが含まれているかどうかを検出するために使用されます。このツールは、Falconsai/nsfwimagedetectio...を使用しています。
6ヶ月前
01.3K0
opensource_notebooklm:基于Deepseek-V3和PlayHT TTS的NotebookLM开源实现

opensource_notebooklm: Deepseek-V3とPlayHT TTSに基づくNotebookLMのオープンソース実装

概論 オープンソースNotebookLMは、Deepseek-V3の言語理解能力とPlayHTの音声合成技術を組み合わせた革新的な人工知能プロジェクトであり、インテリジェントなノート作成対話システムを目指しています。このプロジェクトは、Build Fast社によって開発されました。
5ヶ月前
01.3K0
OuteTTS:实验性文本转语音模型,使用纯语言建模方法实现的TTS

OuteTTS: 実験的音声合成モデル、純粋な言語モデリングアプローチで実装されたTTS

包括的な紹介 OuteTTSは、純粋な言語モデリングアプローチを用いて高品質の音声を生成する、実験的な音声合成(TTS)モデルです。従来のTTSシステムとは異なり、OuteTTSは外部アダプターや複雑なアーキテクチャを必要としません。このモデルは、LLaMaアーキテクチャに基づいています。
4ヶ月前
01.3K0
Aider:开源编程助手工具,使用AI助手进行代码编写和文件编辑

Aider: オープンソースのプログラミングアシスタントツール。

一般的な紹介 Aiderは強力なオープンソースのAIプログラミングアシスタントツールで、開発者が自然言語対話を通してコードを書いたり、編集したり、リファクタリングしたりするのを助けます。対話型AIペアプログラミングツールとして、Aiderは多くの主要なプログラミング言語をサポートし、Gitにシームレスに統合することができます...
2ヶ月前
01.3K0
Dify Connect MCP:Dify 工作流无缝集成 MCP(模型上下文协议)

Dify Connect MCP: DifyワークフローへのMCP(モデルコンテキストプロトコル)のシームレスな統合

概要 Dify Connect MCPは、GitHubでホストされているオープンソースプロジェクトで、Difyプラットフォームのユーザーにモデルコンテキストプロトコル(MCP)を通じてモデリングするための便利なツールを提供することを目的としています...
3ヶ月前
01.3K0
BetterWhisperX:自动语音识别与说话人分离,提供高精度单词级时间戳

BetterWhisperX:話者から切り離された自動音声認識により、高精度の単語レベルのタイムスタンプを提供

はじめに BetterWhisperXは、効率的で正確な自動音声認識(ASR)サービスを提供することに重点を置いたWhisperXプロジェクトの最適化バージョンです。WhisperXの改良版として、このプロジェクトはFederico ...
5ヶ月前
01.3K0
Easegen:开源数字人课程制作平台,PPT一键生成克隆数字人讲解视频

Easegen:オープンソースデジタルヒューマンコース制作プラットフォーム、PPTワンクリック生成クローンデジタルヒューマン講義ビデオ

综合介绍 Easegen 是一个开源的数字人课程制作平台,旨在通过 AI 技术提升教学内容的制作和管理效率。该平台提供从课程制作、视频管理到智能出题的一站式解决方案,用户可以创建数字人讲解的视频课程...
8ヶ月前
01.3K0
cognee:基于知识图谱构建的RAG开源框架,核心prompts学习

cognee:知識グラフベースのRAG構築のためのオープンソースフレームワーク、コアプロンプト学習

概要 CogneeはAIアプリケーションとAIエージェントのために設計された信頼性の高いデータレイヤーソリューションです。LLM(大規模言語モデル)コンテキストのロードと構築を行い、ナレッジグラフとベクトルストアを通じて正確で解釈可能なAIソリューションを作成するように設計されています。このフレームワークは、コスト削減、解釈可能な...
5ヶ月前
01.3K0
RTranslator:语音实时翻译安卓应用,免费且支持离线使用

RTranslator: Android用リアルタイム音声翻訳アプリ!

一般的な紹介 RTranslatorは、Androidデバイスのために設計された事実上オープンソース、無料のオフラインリアルタイム翻訳アプリです。ユーザーはBluetoothヘッドセットを接続することで、携帯電話をポケットに入れたまま、まるで自分の国の言葉を話しているかのように他の人と会話をすることができます。
5ヶ月前
01.3K0
Retrieval based Voice Conversion WebUI:基于检索的语音转换框架|模拟真人歌声

検索ベースの音声変換WebUI:検索ベースの音声変換フレームワーク|実際の歌声をシミュレートする

包括的な導入検索に基づく音声変換WebUIは、使いやすいVITSベースの音声変換フレームワークであり、曲のカバーやリアルタイムの音声変更を含む、あらゆるスピーカー間の音声変換を可能にします。低 ...
8ヶ月前
01.3K0
Story-Adapter:根据长篇故事生成连续且风格一致的图像插画

Story-Adapter:長いストーリーに基づき、連続的で一貫性のあるグラフィック・イラストレーションを生成します。

概論 Story-Adapterは、テキストストーリーを首尾一貫した画像シーケンスに変換する革新的なストーリー視覚化フレームワークである。研究者によって開発されたこのプロジェクトは、高品質のストーリーイラストを生成するためのトレーニングが不要な反復アプローチを採用している。このフレームワークの特徴は、長いストーリーを扱えることである。
5ヶ月前
01.3K0