llm.pdf:在PDF文件中运行大型语言模型的实验项目

llm.pdf:大規模言語モデルをPDFファイルで実行する実験的プロジェクト

一般的な紹介 llm.pdfは、ユーザーが直接PDFファイルで大規模言語モデル(LLM)を実行できるようにするオープンソースプロジェクトです。EvanZhouDevによって開発され、GitHubでホストされているこのプロジェクトは、革新的なアプローチを示しています:Em...
4週間前
02090
Abogen:将多种文本格式转换为有声读物的工具

Abogen:複数のテキスト形式をオーディオブックに変換するツール

一般的な紹介 Abogenは、ePub、PDF、またはプレーンテキストファイルを高品質な音声に素早く変換するために設計されたオープンソースツールです。自然で滑らかな音声を生成するためにKokoro-82Mモデルを使用し、同時字幕生成もサポートしているので、オーディオブックの制作に適しています...
4週間前
01950
Local Deep Research:本地运行的生成深度研究报告工具

ローカル・ディープ・リサーチ:詳細な調査レポートを作成するためのローカルで実行可能なツール

一般的な紹介 Local Deep Research は、ユーザが深い研究を行い、複雑な問題に対する詳細なレポートを作成するために設計されたオープンソースの AI 研究アシスタントです。ローカルでの実行をサポートしており、ユーザーはクラウドサービスに依存することなく研究タスクを完了することができます。このツールは ...
4週間前
02220
Trackers:用于视频对象跟踪的开源工具库

Trackers: ビデオオブジェクト追跡のためのオープンソースツールライブラリ

一般的な紹介 Trackersは、映像内の複数オブジェクトのトラッキングに特化したオープンソースのPythonツールライブラリです。SORTやDeepSORTのようないくつかの主要なトラッキングアルゴリズムを統合しており、ユーザーは異なるオブジェクト検出モデル(YOLO...
4週間前
02080
Kimi-Audio:开源音频处理与对话基础模型

Kimi-Audio:オープンソースの音声処理と対話ベースモデル

一般的な紹介 Kimi-Audioは、Moonshot AIによって開発されたオープンソースの音声ベースモデルで、音声の理解、生成、対話に焦点を当てています。音声認識、音声Q&A、音声感情認識など、幅広い音声処理タスクをサポートしています。このモデルは130以上のテストが行われています。
4週間前
02280
Cooragent:一句话构建多智能体任务协作工具

Cooragent: マルチインテリジェンス・タスク・コラボレーション・ツールの構築

一般的な紹介 Cooragentは、清華大学のLeapLabによって開発され、GitHubでホストされているオープンソースのAIエージェントコラボレーションフレームワークです。ユーザーは、1文の記述でインテリジェントなAIエージェントを作成することができ、複雑なタスクで共同作業する複数のエージェントをサポートしています。このフレームワークは2つの...
4週間前
01980
InstantCharacter:从单张图片生成一致性角色的开源工具

InstantCharacter:単一の画像から一貫性のある文字を生成するオープンソースツール

概要 InstantCharacterは、Tencent HunyuanとInstantXチームによって開発されたオープンソースプロジェクトで、GitHubでホストされています。InstantCharacterは、参照画像とテキスト説明文を含む、一貫性のある文字マップを生成します。
4週間前
02150
Claude生成深度研究报告的MCP服务

詳細な調査レポートを作成するクロードのMCPサービス

一般的な紹介 MCP Server Deep Researchは、人工知能とウェブ検索によって複雑な問題の構造化された調査レポートを自動的に生成するオープンソースツールです。ユーザーがリサーチクエスチョンを入力すると、ツールはそのクエスチョンを分解し、権威ある情報を検索し、ソースの信頼性を評価します。
4週間前
02010
Deep Recall:为大模型提供企业级记忆框架的开源工具

Deep Recall:大規模モデルのためのエンタープライズクラスのメモリフレームワークを提供するオープンソースツール

包括的な紹介 Deep Recallは、大規模言語モデル(LLM)のために設計されたオープンソースのエンタープライズクラスのメモリフレームワークです。効率的な文脈検索と統合により、超パーソナライズされた応答性を提供します。このフレームワークは、メモリサービス、推論サービス、コーディネータを含む3層アーキテクチャを採用しており、...
4週間前
01940
CleverBee:开源AI研究助手,生成引证研究报告

CleverBee:オープンソースのAIリサーチアシスタントが引用研究を生成

一般的な紹介 CleverBeeはGitHubでホストされているオープンソースのAI研究アシスタントであり、SureScaleAIによって開発された。ウェブブラウジング技術と大規模な言語モデル(GeminiやClaudeなど)を組み合わせることで、ユーザーを支援します...
4週間前
01900
FantasyTalking:生成真实感说话肖像的开源工具

FantasyTalking: リアルな似顔絵を生成するオープンソースツール

一般的な紹介 FantasyTalkingは、Fantasy-AMAPチームによって開発されたオープンソースプロジェクトで、オーディオドライブを通してリアルなトーキングポートレート動画を生成することに焦点を当てています。このプロジェクトは、高度なビデオ拡散モデルWan2.1とオーディオエンコーダWa...
4週間前
02070
Paper2Code:将机器学习论文自动转化为可运行代码

Paper2Code: 機械学習論文を実行可能なコードに自動変換する

一般的な紹介 Paper2Codeは、機械学習論文のコード実装が不足しているという問題を解決することを目的としたオープンソースプロジェクトである。マルチエージェントの大規模言語モデリング(LLM)システムPaperCoderによって、科学論文を実行可能なコードリポジトリに自動的に変換する。このシステムは、計画言語モデリング...
4週間前
02370
On Device AI:iPhone本地运行的AI语音转录与聊天工具

オンデバイスAI:iPhoneネイティブ対応のAI音声書き起こし&チャットツール

一般的な紹介 On-Device AIは、完全にオフラインで動作するAIアプリで、iOS、macOS、およびvisionOSをサポートするAppleデバイス向けに設計されています。ローカルの大規模言語モデル(LLM)の実行、リアルタイムの音声転写、文書分析などを、リンクすることなく提供します。
4週間前
02370