OCR | Sharenet

ordenar

Correo electrónico:actualización hojear felicitaciones

VOP: herramienta de OCR para extraer diagramas complejos y fórmulas matemáticas

Introducción completa Versatile OCR Program es una herramienta de reconocimiento óptico de caracteres (OCR) de código abierto diseñada para trabajar con documentos académicos y educativos complejos. Puede extraer texto, tablas, fórmulas matemáticas, diagramas y esquemas de PDF, imágenes y otros documentos y generar...

hace 3 meses

0575

Analice automáticamente el contenido del PDF y extraiga el texto y las tablas de los servicios de código abierto

Introducción Completa Analiza automáticamente el diseño de documentos PDF, identifica texto, títulos, imágenes, tablas, fórmulas y otros elementos de la página, y determina su orden correcto. La herramienta es compatible con la funcionalidad OCR y puede convertir PDF escaneados en texto con capacidad de búsqueda. Se ejecuta en Docker y proporciona dos modelos...

Últimas herramientas de IA # AI Java Proyecto de código abierto # OCR # Extracción y limpieza de documentos

hace 3 meses

0635

RolmOCR：识别手写和倾斜字符的文档OCR模型

综合介绍 RolmOCR 是由 Reducto AI 团队开发的一款开源光学字符识别（OCR）工具，基于 Qwen2.5-VL-7B 视觉语言模型。它能从图片和 PDF 文件中提取文字，速度比同类工具...

Últimas herramientas de IA # AI Java Proyecto de código abierto # OCR

hace 3 meses

0667

uniOCR: herramienta de reconocimiento de texto multiplataforma y de código abierto

Introducción general uniOCR es una herramienta de reconocimiento de texto de código abierto desarrollada por el equipo mediar-ai. Está basada en el lenguaje Rust y es compatible con los sistemas macOS, Windows y Linux. Los usuarios pueden utilizarla para extraer texto de imágenes...

Últimas herramientas de IA # AI Java Proyecto de código abierto # OCR

hace 3 meses

0576

PDF Craft: herramientas de código abierto para convertir documentos PDF escaneados a Markdown

Introducción general PDF Craft es una herramienta de código abierto diseñada para escanear PDF de libros y convertirlos al formato Markdown. Fue desarrollado por oomol-lab y está alojado en GitHub para los usuarios que les gusta organizar sus libros electrónicos. La herramienta funciona a través de este ...

Últimas herramientas de IA # AI Java Proyecto de código abierto # OCR # Extracción y limpieza de documentos

hace 4 meses

0884

SmolDocling: un modelo de lenguaje visual para el tratamiento eficaz de documentos de pequeño volumen

Introducción completa SmolDocling es un Modelo de Lenguaje Visual (VLM) desarrollado por el equipo ds4sd en colaboración con IBM, construido sobre SmolVLM-256M y alojado en la plataforma Hugging Face. Es de pequeño tamaño, sólo ...

Últimas herramientas de IA # AI Java Proyecto de código abierto # OCR # Extracción y limpieza de documentos

hace 4 meses

0858

Mistral OCR: 94,89% Precisión global, 1.000 páginas/30 segundos, sólo 1 $.

En la larga historia de la civilización humana, cada salto en la forma de adquirir y analizar la información ha contribuido profundamente al progreso social. Desde los antiguos jeroglíficos hasta el papiro portátil, pasando por la posterior aparición de la imprenta y la actual ola digital, cada innovación tecnológica ha ampliado enormemente el paradigma de la difusión del conocimiento humano...

Últimas herramientas de IA # AI Servicios abiertos # OCR # Extracción y limpieza de documentos

hace 4 meses

0773

Ollama OCR: Extracción de texto de imágenes mediante modelos visuales en Ollama

Introducción general Ollama OCR es un potente kit de herramientas de reconocimiento óptico de caracteres (OCR) que utiliza el modelo de lenguaje visual de última generación proporcionado por la plataforma Ollama para extraer texto de imágenes. El proyecto está disponible como paquete Python y proporciona una interfaz Strea...

Últimas herramientas de IA # AI Java Proyecto de código abierto # OCR # Extracción y limpieza de documentos

hace 6 meses

02.2K

STranslate：集成多种翻译接口和OCR功能的轻便翻译工具

综合介绍 STranslate 是一个由 WPF 开发的即用即走的翻译和 OCR 工具。该工具旨在提供高效、便捷的翻译和光学字符识别（OCR）功能，适用于各种语言和文本类型。STranslate 是开...

Últimas herramientas de IA # AI Traducción # OCR

hace 7 meses

01.1K

VisionParser：高精度处理收据和发票的OCR工具，提供API

综合介绍 VisionParser是一款专为处理收据和发票而设计的OCR（光学字符识别）工具。通过先进的生成式AI技术，VisionParser能够快速、准确地将各种收据和发票转换为结构化数据，适用于...

Últimas herramientas de IA # OCR

hace 7 meses

01.1K

Chunkr: un servicio todo en uno que utiliza modelos visuales para la ingestión de documentos y la agrupación inteligente basada en la jerarquía de párrafos de texto.

综合介绍 Chunkr 是一个自托管的 API，专门用于将 PDF、PPTX、DOCX 和 Excel 文件转换为适合 RAG（检索增强生成）和 LLM（大语言模型）使用的数据。该项目由 Lumina...

Últimas herramientas de IA # AI Java Proyecto de código abierto # OCR # Extracción y limpieza de documentos

hace 7 meses

01.3K

Llama OCR：利用免费Llama 3.2 Vision接口，三行代码将图像转换为Markdown的OCR库

综合介绍 Llama OCR 是一个基于 Llama 3.2 Vision 的 OCR（光学字符识别）库，能够将文档转换为 Markdown 格式。该库由 Nutlope 开发，使用 Together...

Últimas herramientas de IA # AI Java Proyecto de código abierto # OCR # Libre Modelo Grande API

hace 7 meses

01.4K

Docling：支持多种格式文档解析并导出为Markdown和JSON，PDF支持OCR

Docling: soporte para una variedad de formatos de análisis sintáctico de documentos y exportación como Markdown y JSON, soporte PDF OCR

Introducción Docling es una potente herramienta de análisis y exportación de documentos compatible con una amplia gama de formatos, como PDF, DOCX, PPTX, XLSX, Image, HTML, AsciiDoc y Markdown, que puede analizar y exportar...

Últimas herramientas de IA # AI Java Proyecto de código abierto # OCR # Extracción y limpieza de documentos

hace 7 meses

02.1K

ViTLP：排版复杂PDF文档提取结构化数据，视觉引导生成文本布局预训练模型

综合介绍 ViTLP（Visually Guided Generative Text-Layout Pre-training for Document Intelligence）是一个开源项目，旨在通...

Últimas herramientas de IA # OCR # Extracción y limpieza de documentos

hace 7 meses

01.2K

ScreenPipe：24小时收集录屏和操作信息并转换为本地知识库，通过AI助手对话、总结、回顾知识

综合介绍 ScreenPipe 是一款由 mediar-ai 开发的 AI 助手工具，专注于 24 小时不间断的录制屏幕内容、捕获截图和音频。它结合了 rewind.ai 和 cursor.com 的...

Últimas herramientas de IA # Herramienta AI de resumen de texto y audio/vídeo # AI Notas # OCR

hace 8 meses

01.6K

文本提取API（text-extract-api）：视觉提取文本信息，匿名化的PDF提取工具

API de extracción de texto (text-extract-api): extracción visual de información textual, herramienta de extracción anónima de PDF

Introducción general La API de extracción de texto (text-extract-api) es una potente herramienta diseñada para extraer y analizar el contenido de diversos formatos de documento (por ejemplo, PDF, Word, PPTX, etc.). La API utiliza tecnología punta de reconocimiento óptico de caracteres (OCR) y Ol...

Últimas herramientas de IA # AI Java Proyecto de código abierto # OCR # Extracción y limpieza de documentos

hace 6 meses

01.5K

Picture to Excel Free Tool: Identifique eficazmente tablas con formato complejo en imágenes y conviértalas a archivos Excel.

综合介绍图片转Excel免费工具是一款高效的在线工具，能够快速准确地识别并转换图片中的表格数据至Excel文件。该工具支持多种图片格式，如JPG和PNG，并且可以在网页、iOS应用和Android应...

Últimas herramientas de IA # OCR

hace 9 meses

01.4K

Datalab：专用OCR识别AI模型，PDF转Markdown（开源/API）

Datalab: modelo AI dedicado al reconocimiento OCR, PDF a Markdown (código abierto/API)

Introducción completa Datalab ofrece una gama de modelos avanzados de IA centrados en OCR, análisis de diseño, conversión de PDF a Markdown y mucho más. Estos modelos no sólo son de alto rendimiento, sino también fáciles de usar y de código abierto. Los modelos Marker de la plataforma pueden...

Últimas herramientas de IA # AI Servicios abiertos # AI Java Proyecto de código abierto # OCR

hace 8 meses

01.6K