PDFコンテンツを自動的に解析し、オープンソースサービスのテキストとテーブルを抽出します。综合介绍 它能自动分析PDF文档的布局,识别页面中的文字、标题、图片、表格、公式等元素,并判断它们的正确顺序。工具支持OCR功能,可以把扫描PDF转为可搜索文本。它基于Docker运行,提供两种模型...最新のAIツール# AI Java オープンソースプロジェクト# OCR# ドキュメントの抽出とクリーニング2ヶ月前04090
ドルフィン:アジア言語認識とアジア言語のための音声テキストモデル総合紹介 Dolphinは、DataoceanAIと清華大学によって開発された、アジア言語の音声認識と言語認識に特化したオープンソースモデルです。東アジア、南アジア、東南アジア、中東の40の言語と22の中国語方言をサポートしています。最新のAIツール# AI Java オープンソースプロジェクト# AI音声合成2ヶ月前03780
AstrBot:WebUIを備えたAIチャットボット・アクセス・プラットフォーム综合介绍 AstrBot 是一个开源的聊天机器人开发框架,它支持 QQ、Telegram、微信等多种消息平台,并能轻松接入 OpenAI、DeepSeek、Google Gemini 等大语言模型(L...最新のAIツール# AI接客ロボット# AI Java オープンソースプロジェクト2ヶ月前03970
WeClone:WeChatのチャットログと音声を使ったデジタル・ドッペルゲンガーの育成総合的な紹介 WeCloneは、WeChatのチャット記録と音声メッセージを、大規模な言語モデルと音声合成技術と組み合わせて使用するオープンソースプロジェクトであり、ユーザーはパーソナライズされたデジタル・ドッペルゲンガーを作成することができます。このプロジェクトは、ユーザーのチャットの習慣を分析してモデルを訓練するだけでなく、少数の音声サンプルを使ってリアルな音声を生成することができます。最新のAIツール# AI Java オープンソースプロジェクト# 大型モデルの微調整2ヶ月前03880
DiffPortrait360: 1枚のポートレートから360度のヘッドビューを生成概論 DiffPortrait360はオープンソースプロジェクトであり、CVPR 2025の論文 "DiffPortrait360: Consistent Portrait Diffusion for 360... "に関連している。最新のAIツール# AIイメージスタイルコントロール# AI Java オープンソースプロジェクト2ヶ月前03790
Text2Voice:シリコンベースのフローAPIに基づく音声合成グラフィカルインターフェース一般的な紹介 Text2Voiceは、シリコンベースのモビリティAPIに基づいた音声合成機能を提供するオープンソースツールで、クリーンなグラフィカル・ユーザー・インターフェース(GUI)が最大の特徴である。開発者のシェルドン・リーがGitHubで作成したもので、...最新のAIツール# AI Java オープンソースプロジェクト# AI音声合成2ヶ月前03630
mcp-ui: MCPプロトコルに基づいたクリーンなAIチャットインターフェース包括的な紹介 mcp-uiは、開発者machaojin1917939763によって作成されたオープンソースプロジェクトであり、構築するためのモデルコンテキストプロトコル(MCP)プロトコルに基づき、Webおよびデスクトップ環境のためのサポートです スマート ...最新のAIツール# AI Java オープンソースプロジェクト# AIローカライズチャットアプリケーション2ヶ月前04320
Comp AI: SOC 2、ISO 27001、GDPR コンプライアンスを自動化するオープンソースプラットフォーム概要 Comp AIは、米国サンフランシスコに本社を置くComp AI社によって開発されたオープンソースのプラットフォームです。自動化されたツールにより、SOC 2、ISO 27001、GDPRなどのコンプライアンス要件を迅速に完了することができます。最新のAIツール# AI Java オープンソースプロジェクト# プロフェッショナル生産性ツール2ヶ月前03530
RolmOCR: 手書き文字と斜め文字を認識する文書OCRモデル综合介绍 RolmOCR 是由 Reducto AI 团队开发的一款开源光学字符识别(OCR)工具,基于 Qwen2.5-VL-7B 视觉语言模型。它能从图片和 PDF 文件中提取文字,速度比同类工具...最新のAIツール# AI Java オープンソースプロジェクト# OCR2ヶ月前04410
AiryLark:多フォーマット文書のインテリジェント翻訳のためのオープンソースツール一般的な紹介 AiryLarkはGitHubでホストされているオープンソースの文書処理・翻訳ツールで、開発者のwizdによってNext.jsフレームワークに基づいて構築されています。様々なファイル形式(PDF、Word、TXT、Markdo...など)をサポートしています。最新のAIツール# AI Java オープンソースプロジェクト# AI翻訳2ヶ月前03690
Zola:ドキュメントのアップロードとマルチモデルをサポートするオープンソースのAIチャット・ウェブアプリ一般的な紹介 Zolaは、開発者のJulien Thibeaut(GitHubユーザー名ibelick)によって開発され、GitHubでホストされているフリーでオープンソースのAIチャットアプリである。最大の特徴は、複数のAIモードをサポートしていることです。最新のAIツール# AI Java オープンソースプロジェクト# AIローカライズチャットアプリケーション# AI統合マルチモデル対話プラットフォーム2ヶ月前04090
DeepResearcher:複雑な問題を研究する強化学習ベースのドライビングAI包括的な紹介 DeepResearcherは、上海交通大学のGAIR-NLPチームによって開発されたオープンソースプロジェクトです。強化学習(RL)によって実際のウェブ環境でエンドツーエンドで学習された大規模言語モデル(LLM)に基づくインテリジェントな研究ツールです。プロジェクト...最新のAIツール# AI Java オープンソースプロジェクト# 詳細な調査レポートの作成2ヶ月前03440
AnimeGamer: 言語コマンドでアニメ動画とキャラクターのインタラクションを生成するオープンソースツールAnimeGamerはテンセントのARC Labが開発したオープンソースツール。ユーザーは、「宗介が紫の車でドライブする」といった簡単な言語コマンドでアニメ動画を生成したり、「魔法少女の冒険」のキキや「スカイシティ」...といった異なるアニメキャラクターを相互作用させたりすることができる。最新のAIツール# AI Java オープンソースプロジェクト# AI動画生成ツール# AI動画変換スタイル2ヶ月前03800
Lumina-MGPT-2.0:複数の画像生成タスクを扱うための自己回帰画像生成モデル综合介绍 Lumina-mGPT-2.0 是由上海人工智能实验室(Shanghai AI Laboratory)、香港中文大学(CUHK)等机构联合开发的开源项目,托管于 GitHub,由 Alpha...最新のAIツール# AI Java オープンソースプロジェクト2ヶ月前03870
Aider: オープンソースのプログラミングアシスタントツール。一般的な紹介 Aiderは強力なオープンソースのAIプログラミングアシスタントツールで、開発者が自然言語対話を通してコードを書いたり、編集したり、リファクタリングしたりするのを助けます。対話型AIペアプログラミングツールとして、Aiderは多くの主要なプログラミング言語をサポートし、Gitにシームレスに統合することができます...最新のAIツール# AI Java オープンソースプロジェクト# AIプログラミング2ヶ月前01.3K0
エージェントS:人間のようにコンピュータを操作する知的体のためのオープンソース・フレームワーク综合介绍 Agent S 是由 Simular AI 开发的开源框架,让智能体通过图形用户界面(GUI)像人类一样操作电脑。它使用多模态大语言模型和经验学习技术,能完成浏览网页、编辑文档、使用软件等任...最新のAIツール# AI Java オープンソースプロジェクト# デスクトップ・オートメーション・インテリジェンス2ヶ月前04390
FreeAI: PollinationsパッケージをベースにしたフリーのAIツール。概要 FreeAIは、Pollinations.AI APIをベースとしたオープンソースのAIアプリケーションプラットフォームで、無料で無制限のAIチャットアシスタント、画像生成、音声合成サービスを提供している。このプロジェクトは、開発者のAzad-slによってG...最新のAIツール# AI Java オープンソースプロジェクト# AI統合マルチモデル対話プラットフォーム2ヶ月前03880
最適化されたコード生成と表示のためのオープンWebUI概論 Open WebUI Artifacts OverhaulはOpen WebUIをベースにしたフォークプロジェクトで、開発者のNick Tonjumによって開発された。AIが生成したコードを改善することに焦点を当てたオープンソースツールです。AIニュース# AI Java オープンソースプロジェクト# AIローカライズチャットアプリケーション2ヶ月前03720
Gaze-LLE:映像中の人物注視のターゲット予測ツール综合介绍 Gaze-LLE是一款基于大规模学习编码器的注视目标预测工具。该项目由Fiona Ryan、Ajay Bati、Sangmin Lee、Daniel Bolya、Judy Hoffman和J...最新のAIツール# AI Java オープンソースプロジェクト# 視覚ターゲット検出2ヶ月前09670