OCR | Sharenet

順番に並べる

ポスト更新目を通すクドス

VOP: 複雑な図や数式を抽出するOCRツール

综合介绍 Versatile OCR Program 是一个开源的光学字符识别（OCR）工具，专门为处理复杂的学术和教育文档设计。它能从PDF、图像等文件中提取文本、表格、数学公式、图表和示意图，并生...

3ヶ月前

0563

PDFコンテンツを自動的に解析し、オープンソースサービスのテキストとテーブルを抽出します。

综合介绍它能自动分析PDF文档的布局，识别页面中的文字、标题、图片、表格、公式等元素，并判断它们的正确顺序。工具支持OCR功能，可以把扫描PDF转为可搜索文本。它基于Docker运行，提供两种模型...

3ヶ月前

0615

RolmOCR: 手書き文字と斜め文字を認識する文書OCRモデル

综合介绍 RolmOCR 是由 Reducto AI 团队开发的一款开源光学字符识别（OCR）工具，基于 Qwen2.5-VL-7B 视觉语言模型。它能从图片和 PDF 文件中提取文字，速度比同类工具...

最新のAIツール # AI Java オープンソースプロジェクト # OCR

3ヶ月前

0655

uniOCR: クロスプラットフォームのオープンソーステキスト認識ツール

概論 uniOCRはmediar-aiチームによって開発されたオープンソースのテキスト認識ツールです。Rust言語に基づいており、macOS、Windows、Linuxシステムをサポートしています。画像からテキストを抽出することができます。

最新のAIツール # AI Java オープンソースプロジェクト # OCR

3ヶ月前

0562

PDF Craft: PDFスキャン文書からMarkdownへのオープンソースツール

综合介绍 PDF Craft 是一个开源工具，专为扫描书籍的PDF设计，能将其转换为Markdown格式。它由 oomol-lab 开发，托管在 GitHub 上，适合喜欢整理电子书的用户。工具通过本...

4ヶ月前

0871

SmolDocling：少量で効率的な文書処理のための視覚言語モデル

综合介绍 SmolDocling 是由 ds4sd 团队与 IBM 合作开发的一个视觉语言模型（VLM），基于 SmolVLM-256M 打造，托管在 Hugging Face 平台。它体积小，只有 ...

4ヶ月前

0839

ミストラルOCR：94.89%総合精度、1000ページ/30秒、わずか1ドル

在人类文明的历史长河中，每一次信息获取和解析方式的飞跃，都深刻地推动着社会进步。从远古的象形文字，到便携的纸莎草，再到后来出现的印刷术以及当今的数字化浪潮，每一次技术革新都极大地拓展了人类知识的传播范...

4ヶ月前

0766

Ollama OCR: Ollamaの視覚モデルを使った画像からのテキスト抽出

综合介绍 Ollama OCR是一个强大的光学字符识别(OCR)工具包，它利用Ollama平台提供的最先进视觉语言模型来从图像中提取文本。该项目既可作为Python包使用，也提供了用户友好的Strea...

6ヶ月前

02.2K

STranslate：複数の翻訳インターフェースとOCR機能を備えた軽量翻訳ツール

一般的な紹介 STranslateは、WPFによって開発されたすぐに使用できる翻訳とOCRツールです。このツールは、幅広い言語とテキストタイプに対して、効率的で便利な翻訳と光学式文字認識（OCR）機能を提供するように設計されています。

最新のAIツール # AI翻訳 # OCR

7ヶ月前

01.1K

VisionParser：領収書や請求書を高精度に処理するOCRツール、APIあり

综合介绍 VisionParser是一款专为处理收据和发票而设计的OCR（光学字符识别）工具。通过先进的生成式AI技术，VisionParser能够快速、准确地将各种收据和发票转换为结构化数据，适用于...

最新のAIツール # OCR

7ヶ月前

01.1K

Chunkr: 文書の取り込みにビジュアルモデルを使用し、テキストの段落階層に基づくインテリジェントなチャンキングを行うオールインワンサービス。

综合介绍 Chunkr 是一个自托管的 API，专门用于将 PDF、PPTX、DOCX 和 Excel 文件转换为适合 RAG（检索增强生成）和 LLM（大语言模型）使用的数据。该项目由 Lumina...

7ヶ月前

01.3K

Llama OCR：利用免费Llama 3.2 Vision接口，三行代码将图像转换为Markdown的OCR库

Llama OCR: 3行のコードで画像をMarkdownに変換するOCRライブラリ。

概要 Llama OCRは、Llama 3.2 VisionをベースにしたOCR（光学式文字認識）ライブラリで、文書をMarkdown形式に変換することができます。このライブラリーはNutlope社によって開発され、Togetherを使用しています。

7ヶ月前

01.4K

Docling：支持多种格式文档解析并导出为Markdown和JSON，PDF支持OCR

Docling：様々なフォーマットのドキュメントをサポート MarkdownやJSONへの解析とエクスポート PDFサポート OCR

包括的な紹介 Doclingは、PDF、DOCX、PPTX、XLSX、画像、HTML、AsciiDocおよびMarkdownを含む幅広い文書形式をサポートする強力な文書解析およびエクスポートツールです。

7ヶ月前

02.1K

ViTLP: 組版が複雑なPDF文書から構造化データを抽出し、テキストレイアウトのための事前学習済みモデルを視覚的に誘導して生成する

综合介绍 ViTLP（Visually Guided Generative Text-Layout Pre-training for Document Intelligence）是一个开源项目，旨在通...

最新のAIツール # OCR # ドキュメントの抽出とクリーニング

7ヶ月前

01.2K

ScreenPipe：24小时收集录屏和操作信息并转换为本地知识库，通过AI助手对话、总结、回顾知识

ScreenPipe：記録された画面や操作情報を24時間収集し、AIアシスタント対話、要約、知識の見直しを通じて、ローカルの知識ベースに変換する

概要 ScreenPipeはmediar-aiによって開発されたAIアシスタントツールで、スクリーンコンテンツの録画、スクリーンショットのキャプチャ、24時間365日の音声の録音に特化しています。rewind.aiとcursor.comを組み合わせたものです。

8ヶ月前

01.6K

文本提取API（text-extract-api）：视觉提取文本信息，匿名化的PDF提取工具

テキスト抽出 API (text-extract-api): テキスト情報の視覚的抽出、匿名化 PDF 抽出ツール

包括的な紹介テキスト抽出API（text-extract-api）は、さまざまな文書形式（PDF、Word、PPTXなど）からコンテンツを抽出し、解析するために設計された強力なツールです。このAPIは、最先端の光学式文字認識（OCR）技術とOl...

6ヶ月前

01.5K

Picture to Excelフリーツール: 写真の複雑な書式を持つ表を効率的に識別し、Excelファイルに変換します。

综合介绍图片转Excel免费工具是一款高效的在线工具，能够快速准确地识别并转换图片中的表格数据至Excel文件。该工具支持多种图片格式，如JPG和PNG，并且可以在网页、iOS应用和Android应...

最新のAIツール # OCR

9ヶ月前

01.4K

Datalab：专用OCR识别AI模型，PDF转Markdown（开源/API）

Datalab：専用のOCR認識AIモデル、PDF to Markdown（オープンソース/API）

综合介绍 Datalab 提供了一系列先进的AI模型，专注于OCR、布局分析、PDF转Markdown等功能。这些模型不仅性能卓越，而且易于使用，并且是开源的。平台上的Marker模型可以快速准确地将...

8ヶ月前

01.6K

eSearch：多機能クロスプラットフォームOCRツール、統合検索｜翻訳｜検索マップ｜画面録画およびその他の機能

综合介绍 eSearch 是一款由 xushengfeng 开发的开源跨平台截图工具，支持 Windows、macOS 和 Linux 系统。它集成了多种功能，包括截图、OCR 识别、搜索、翻译、贴图...

最新のAIツール # OCR

9ヶ月前

01.4K