文档提取与清洗 - 第4页

organizar em ordem

postagem atualização passar por cima elogios

Trieve: uma infraestrutura de nuvem RAG de serviço completo que fornece pesquisa, recomendações e análises

综合介绍 Trieve 是由 Devflow, Inc. 开发的全方位基础设施，专为搜索、推荐、RAG（检索增强生成）和分析而设计。该平台通过 API 提供服务，支持自托管，适用于 AWS、GCP、K...

Ferramentas de IA mais recentes # Serviços abertos de IA # Extração e limpeza de documentos

6 meses atrás

09520

pdf2htmlEX：PDF无损转换为HTML，保持文本格式，适用于学术论文和杂志排版

pdf2htmlEX: Conversão sem perdas de PDF para HTML, mantendo a formatação do texto, adequada para trabalhos acadêmicos e composição de revistas

综合介绍 pdf2htmlEX 是一个开源工具，旨在将 PDF 文件转换为 HTML 格式，通过分析 PDF 文件的内容并使用 HTML + CSS 精确还原其视觉效果, 将 PDF 文档转换为浏览器...

Ferramentas de IA mais recentes # Projeto de código aberto AI Java # Extração e limpeza de documentos

6 meses atrás

01.1K0

OmniParse: extrai quaisquer dados não estruturados de documentos/multimídia e os analisa em dados estruturados

综合介绍 OmniParse是一个强大的数据解析与优化平台，旨在将任何非结构化数据转换为结构化、可操作的数据，优化后适用于GenAI（生成式人工智能）框架。无论是处理文档、表格、图像、视频、音频文件还...

Ferramentas de IA mais recentes # Projeto de código aberto AI Java # Extração e limpeza de documentos

7 meses atrás

01.2K0

Parsio: extraia automaticamente os principais dados estruturados de PDFs, e-mails e outros documentos

综合介绍 Parsio 是一款基于 AI 技术的文档和邮件数据提取工具，能够自动从 PDF、电子邮件及其他文档中提取结构化数据。该平台提供强大的 PDF 解析器和 OCR 功能，支持多种文档类型，包括...

Ferramentas de IA mais recentes # Extração e limpeza de documentos

7 meses atrás

01.3K0

TextIn: ferramenta universal de conversão de documentos, PDF para Markdown

综合介绍 TextIn是一款专业的PDF转Markdown工具，旨在帮助用户高效地将PDF文档转换为Markdown格式。该工具支持多种文件格式，操作简单，转换速度快，能够保留原始PDF的格式和内容...

Ferramentas de IA mais recentes # Extração e limpeza de documentos

7 meses atrás

01.1K0

Datalab：专用OCR识别AI模型，PDF转Markdown（开源/API）

Datalab: modelo de IA de reconhecimento de OCR dedicado, PDF para Markdown (código aberto/API)

综合介绍 Datalab 提供了一系列先进的AI模型，专注于OCR、布局分析、PDF转Markdown等功能。这些模型不仅性能卓越，而且易于使用，并且是开源的。平台上的Marker模型可以快速准确地将...

Ferramentas de IA mais recentes # Serviços abertos de IA # Projeto de código aberto AI Java # OCR

7 meses atrás

01.3K0

MinerU：PDF文档提取转换为多模态Markdown格式，支持电子书OCR扫描

MinerU: extração e conversão de documentos PDF para o formato Markdown multimodal, suporte à digitalização OCR de e-books

Introdução abrangente O MinerU é uma ferramenta de extração de dados de código aberto desenvolvida pela equipe do OpenDataLab no Laboratório de Inteligência Artificial de Xangai, com foco na extração eficiente de conteúdo de documentos PDF complexos, páginas da Web e eBooks. Ele é capaz de obter PDFs multimodais contendo imagens, fórmulas, tabelas e outros elementos...

Ferramentas de IA mais recentes # Projeto de código aberto AI Java # OCR # Extração e limpeza de documentos

8 meses atrás

01.6K0