Knowledge Table : un outil open source pour l'extraction et l'exploration efficaces de données structurées

Derniers outils d'IAPosté il y a 9 mois Sharenet.ai

1.4K 0

Introduction générale

Knowledge Table est un projet open source conçu pour simplifier le processus d'extraction et d'exploration de données structurées à partir de documents non structurés. Les utilisateurs peuvent créer des représentations de connaissances structurées telles que des tableaux et des graphiques par le biais d'une interface d'interrogation en langage naturel. L'outil prend en charge des règles d'extraction et des options de formatage personnalisées, et assure la traçabilité des données en affichant les sources de données par le biais d'une interface utilisateur. Knowledge Sheets offre aux utilisateurs professionnels une interface familière de feuille de calcul, tout en fournissant aux développeurs un backend flexible et hautement configurable pour une variété de besoins de traitement de données.

Liste des fonctions

l'extraction du langage naturel (ELN)Les données structurées peuvent être extraites de documents non structurés à l'aide de requêtes en langage naturel.
Règles d'extraction personnaliséesLes utilisateurs peuvent définir des règles d'extraction pour garantir la qualité des données.
contrôle du formatLe format de sortie des données extraites peut être contrôlé.
Filtrage des documentsFiltrer les documents en fonction des métadonnées ou des données extraites.
Exportation de triades au format CSV ou cartographiqueLe logiciel permet de télécharger les données extraites au format CSV ou au format tuple.
extraction de la chaîneLes questions peuvent faire référence à des chroniques antérieures.

Utiliser l'aide

Installation et fonctionnement

Docker en cours d'exécution: :
- Assurez-vous que Docker et Docker Compose sont installés.
- Utilisation des commandes docker-compose up -d --build Lancer l'application.
- Accès à la partie frontale http://localhost:3000 et le back-end http://localhost:8000.
opération locale: :
- Clonage de la base de code :git clone https://github.com/yourusername/knowledge-table.git
- Allez dans le répertoire backend et créez un environnement virtuel :
```
cd knowledge-table/backend/
python3 -m venv venv
source venv/bin/activate  # Windows使用 venv\Scripts\activate
pip install -r requirements.txt
```
- Démarrer le service back-end :
```
cd src/
python -m uvicorn knowledge_table_api.main:app
```
Paramètres frontaux: :
- Allez dans le répertoire front-end et installez les dépendances :
```
cd ../frontend/
curl https://bun.sh/install | bash  # 安装Bun
bun install
bun start
```
- Les services frontaux se trouvent dans la section http://localhost:5173 Accès.

Processus d'utilisation

Télécharger un documentLes documents non structurés sont téléchargés dans la table des connaissances, le système les divise en morceaux et les stocke dans une base de données vectorielle.
Définition des problèmes et des règlesDéfinir le type de données à extraire et les questions correspondantes, que le système traitera sur la base de ces informations.
Voir les résultatsL'utilisateur peut visualiser le résultat structuré après le traitement des données et procéder aux ajustements nécessaires.

mise en garde

Veiller à ce que les lois et règlements pertinents soient respectés afin d'éviter de porter atteinte aux droits et aux intérêts d'autrui.
Les données extraites sont régulièrement validées afin de garantir leur exactitude et leur actualité.