自动解析PDF内容并提取文字与表格的开源服务

Analyse automatique du contenu des PDF et extraction du texte et des tableaux des services open source

Introduction complète Il analyse automatiquement la mise en page des documents PDF, identifie le texte, les titres, les images, les tableaux, les formules et autres éléments de la page, et détermine leur ordre correct. L'outil prend en charge la fonctionnalité OCR et peut convertir les PDF numérisés en texte consultable. Il fonctionne sur Docker et fournit deux modèles...
Il y a 2 mois
03960