自动解析PDF内容并提取文字与表格的开源服务

Analyse automatique du contenu des PDF et extraction du texte et des tableaux des services open source

Introduction complète Il analyse automatiquement la mise en page des documents PDF, identifie le texte, les titres, les images, les tableaux, les formules et autres éléments de la page, et détermine leur ordre correct. L'outil prend en charge la fonctionnalité OCR et peut convertir les PDF numérisés en texte consultable. Il fonctionne sur Docker et fournit deux modèles...
Il y a 2 mois
04020
Dolphin:面向亚洲语言识别与语音转文本模型

Dolphin : Reconnaissance des langues asiatiques et modélisation de la parole vers le texte pour les langues asiatiques

Introduction complète Dolphin est un modèle open source développé par DataoceanAI et l'université de Tsinghua, qui se concentre sur la reconnaissance vocale et linguistique pour les langues asiatiques. Il prend en charge 40 langues d'Asie de l'Est, d'Asie du Sud, d'Asie du Sud-Est et du Moyen-Orient, ainsi que 22 dialectes chinois...
Il y a 2 mois
03710
WeClone:用微信聊天记录和语音训练数字分身

WeClone : former des sosies numériques à l'aide des journaux de conversation et des voix WeChat

Introduction complète WeClone est un projet open source qui utilise les transcriptions de chat et les messages vocaux de WeChat, combinés à de grands modèles de langage et à une technologie de synthèse vocale, pour permettre aux utilisateurs de créer des sosies numériques personnalisés. Le projet peut analyser les habitudes de chat de l'utilisateur pour entraîner le modèle, mais aussi un petit nombre d'échantillons de voix pour générer des sons réalistes...
Il y a 2 mois
03790
Comp AI:自动化SOC 2、ISO 27001和GDPR合规的开源平台

Comp AI : une plateforme open source pour automatiser la conformité SOC 2, ISO 27001 et GDPR

Introduction générale Comp AI est une plateforme open source développée par Comp AI, Inc. basée à San Francisco, aux États-Unis. Elle aide les organisations à remplir rapidement les exigences de conformité telles que SOC 2, ISO 27001 et GDPR à l'aide d'outils automatisés, dans le but de...
Il y a 2 mois
03460