Ollama OCR: Ollamaの視覚モデルを使った画像からのテキスト抽出综合介绍 Ollama OCR是一个强大的光学字符识别(OCR)工具包,它利用Ollama平台提供的最先进视觉语言模型来从图像中提取文本。该项目既可作为Python包使用,也提供了用户友好的Strea...最新のAIツール# AI Java オープンソースプロジェクト# OCR# ドキュメントの抽出とクリーニング5ヶ月前01.9K0
Docling:様々なフォーマットのドキュメントをサポート MarkdownやJSONへの解析とエクスポート PDFサポート OCR综合介绍 Docling 是一个强大的文档解析和导出工具,支持多种文档格式,包括 PDF、DOCX、PPTX、XLSX、图像、HTML、AsciiDoc 和 Markdown。它能够将这些文档解析并导...最新のAIツール# AI Java オープンソースプロジェクト# OCR# ドキュメントの抽出とクリーニング6ヶ月前01.8K0
Umi-OCR: オープンソースのオフラインOCRソフトウェア、バッチ画像認識、PDF認識Umi-OCR 综合介绍 Umi-OCR是一款开源、免费的离线OCR软件,支持截屏、批量导入图片、PDF文档识别、排除水印和页眉页脚、扫描和生成二维码。该软件内置多国语言库,适用于Windows和Li...最新のAIツール# OCR9ヶ月前01.7K0
Surya: プロフェッショナルな多言語ドキュメントOCRツール、オープンソース・ネイティブデプロイメント综合介绍 Surya是一个开源的多语言文档OCR工具包,支持90多种语言的文本识别。它不仅能够进行逐行文本检测,还能进行布局分析、阅读顺序检测和表格识别。Surya的性能与云服务相媲美,适用于各种类型...最新のAIツール# AI Java オープンソースプロジェクト# OCR8ヶ月前01.6K0
MinerU: PDFドキュメントの抽出とマルチモーダルMarkdownフォーマットへの変換、電子書籍OCRスキャンのサポート综合介绍 MinerU是由上海人工智能实验室OpenDataLab团队开发的一款开源数据提取工具,专注于从复杂的PDF文档、网页和电子书中高效提取内容。它能够将包含图片、公式、表格等元素的多模态PDF...最新のAIツール# AI Java オープンソースプロジェクト# OCR# ドキュメントの抽出とクリーニング8ヶ月前01.6K0
Pix2Text: オープンソースのフリー画像テキスト認識ツールPix2Text 综合介绍 Pix2Text (P2T) 是一个开源的免费工具,旨在替代 Mathpix,提供图片文字和数学公式识别功能。用户可以通过网页版免费使用该工具,每天最多识别 10000 个...最新のAIツール# OCR9ヶ月前01.5K0
PixPin:長尺でダイナミックなスクリーンショット、ネイティブテキスト認識(OCR)内蔵综合介绍 PixPin是一款功能强大的截图和贴图工具,旨在提升用户的工作效率。无论是日常办公还是专业需求,PixPin都能提供便捷的截图、贴图、长截图、文字识别(OCR)和动态截图功能。其简洁的界面和...最新のAIツール# OCR8ヶ月前01.4K0
GOT-OCR2.0: QWen2 0.5Bエンドツーエンド・マルチモーダルOCRモデルに基づく综合介绍 GOT-OCR2.0是一个阶跃星辰联合推出de 开源光学字符识别(OCR)模型,旨在通过一个统一的端到端模型推动OCR技术向OCR-2.0迈进。该模型支持多种OCR任务,包括普通文本识别、格...最新のAIツール# AI Java オープンソースプロジェクト# OCR9ヶ月前01.4K0
ScreenPipe:記録された画面や操作情報を24時間収集し、AIアシスタント対話、要約、知識の見直しを通じて、ローカルの知識ベースに変換する综合介绍 ScreenPipe 是一款由 mediar-ai 开发的 AI 助手工具,专注于 24 小时不间断的录制屏幕内容、捕获截图和音频。它结合了 rewind.ai 和 cursor.com 的...最新のAIツール# AIテキストおよび音声/ビデオ要約ツール# AIノート# OCR6ヶ月前01.4K0
PaddleOCR: Flying Paddleベースの多言語OCRツールライブラリ。综合介绍 PaddleOCR 是一个基于 PaddlePaddle 的多语言 OCR 工具包,旨在提供实用且超轻量级的 OCR 系统。它支持超过 80 种语言的识别,并提供数据标注和合成工具,支持在服...最新のAIツール# AI Java オープンソースプロジェクト# OCR6ヶ月前01.3K0
Datalab:専用のOCR認識AIモデル、PDF to Markdown(オープンソース/API)综合介绍 Datalab 提供了一系列先进的AI模型,专注于OCR、布局分析、PDF转Markdown等功能。这些模型不仅性能卓越,而且易于使用,并且是开源的。平台上的Marker模型可以快速准确地将...最新のAIツール# AIオープンサービス# AI Java オープンソースプロジェクト# OCR7ヶ月前01.3K0
テキスト抽出 API (text-extract-api): テキスト情報の視覚的抽出、匿名化 PDF 抽出ツール综合介绍 文本提取API(text-extract-api)是一个强大的工具,旨在从各种文档格式(如PDF、Word、PPTX等)中提取和解析内容。该API利用最先进的光学字符识别(OCR)技术和Ol...最新のAIツール# AI Java オープンソースプロジェクト# OCR# ドキュメントの抽出とクリーニング5ヶ月前01.3K0
Llama OCR: 3行のコードで画像をMarkdownに変換するOCRライブラリ。综合介绍 Llama OCR 是一个基于 Llama 3.2 Vision 的 OCR(光学字符识别)库,能够将文档转换为 Markdown 格式。该库由 Nutlope 开发,使用 Together...最新のAIツール# AI Java オープンソースプロジェクト# OCR# Free Large Model API6ヶ月前01.2K0
Picture to Excelフリーツール: 写真の複雑な書式を持つ表を効率的に識別し、Excelファイルに変換します。综合介绍 图片转Excel免费工具是一款高效的在线工具,能够快速准确地识别并转换图片中的表格数据至Excel文件。该工具支持多种图片格式,如JPG和PNG,并且可以在网页、iOS应用和Android应...最新のAIツール# OCR7ヶ月前01.2K0
TTime: 画像認識・テキスト翻訳ソフトウェアTTime 综合介绍 TTime 是由 InkTimeRecord 发布在 GitHub 上的项目,是一款简洁高效的翻译软件。它主要提供输入、截图、划词及悬浮球翻译等功能,支持多种翻译源和文字识别服务...最新のAIツール# AI翻訳# OCR9ヶ月前01.1K0
Chunkr: 文書の取り込みにビジュアルモデルを使用し、テキストの段落階層に基づくインテリジェントなチャンキングを行うオールインワンサービス。综合介绍 Chunkr 是一个自托管的 API,专门用于将 PDF、PPTX、DOCX 和 Excel 文件转换为适合 RAG(检索增强生成)和 LLM(大语言模型)使用的数据。该项目由 Lumina...最新のAIツール# AI Java オープンソースプロジェクト# OCR# ドキュメントの抽出とクリーニング6ヶ月前01.1K0
eSearch:多機能クロスプラットフォームOCRツール、統合検索|翻訳|検索マップ|画面録画およびその他の機能综合介绍 eSearch 是一款由 xushengfeng 开发的开源跨平台截图工具,支持 Windows、macOS 和 Linux 系统。它集成了多种功能,包括截图、OCR 识别、搜索、翻译、贴图...最新のAIツール# OCR8ヶ月前01.1K0
ViTLP: 組版が複雑なPDF文書から構造化データを抽出し、テキストレイアウトのための事前学習済みモデルを視覚的に誘導して生成する综合介绍 ViTLP(Visually Guided Generative Text-Layout Pre-training for Document Intelligence)是一个开源项目,旨在通...最新のAIツール# OCR# ドキュメントの抽出とクリーニング6ヶ月前09800
VisionParser:領収書や請求書を高精度に処理するOCRツール、APIあり综合介绍 VisionParser是一款专为处理收据和发票而设计的OCR(光学字符识别)工具。通过先进的生成式AI技术,VisionParser能够快速、准确地将各种收据和发票转换为结构化数据,适用于...最新のAIツール# OCR5ヶ月前09050