Surya:专业多语言文档OCR工具,开源本地部署

Surya: ferramenta profissional de OCR para documentos multilíngues, implantação nativa de código aberto

Introdução abrangente O Surya é um kit de ferramentas de OCR de documentos multilíngues de código aberto que oferece suporte ao reconhecimento de texto em mais de 90 idiomas. Ele executa não apenas a detecção de texto linha por linha, mas também a análise de layout, a detecção da ordem de leitura e o reconhecimento de tabelas.
8 meses atrás
01.7K0
MinerU:PDF文档提取转换为多模态Markdown格式,支持电子书OCR扫描

MinerU: extração e conversão de documentos PDF para o formato Markdown multimodal, suporte à digitalização OCR de e-books

Introdução abrangente O MinerU é uma ferramenta de extração de dados de código aberto desenvolvida pela equipe do OpenDataLab no Laboratório de Inteligência Artificial de Xangai, com foco na extração eficiente de conteúdo de documentos PDF complexos, páginas da Web e eBooks. Ele é capaz de obter PDFs multimodais contendo imagens, fórmulas, tabelas e outros elementos...
8 meses atrás
01.6K0