Analytics GBI (XiYan-SQL) : L'analyse intelligente des données texte à SQL pour ChatBI en toute simplicité

Derniers outils d'IAMise à jour il y a 7 mois Sharenet.ai
1.3K 0
吐司AI

Introduction générale

Analytics GBI est un produit d'analyse de données intelligent basé sur des modèles de grande taille lancé par Aliyun Bailian. Le produit utilise une technologie avancée de traitement du langage naturel pour aider les utilisateurs à interroger et à analyser les données en langage naturel sans avoir à maîtriser une syntaxe SQL complexe. Analytics GBI prend en charge une variété de sources de données, y compris les bases de données MySQL, PostgreSQL et les fichiers Excel, et offre des options de déploiement flexibles qui prennent en charge les modèles de déploiement hybrides et de cloud public. Sa structure multi-intelligence peut programmer dynamiquement plusieurs intelligences pour exécuter des tâches en fonction de leur complexité, fournissant une analyse efficace des données et des fonctions de visualisation intelligente des graphiques pour améliorer l'efficacité de la prise de décision des utilisateurs et les capacités de compréhension des données.

Produits open source recommandés :DB-GPT : Construction d'un cadre de développement d'applications de données natives de l'IA, intégrant la gestion multi-modèle et le traitement intelligent des données

XiYan-SQL : un cadre d'intégration multi-générateur pour la conversion de texte en SQL

Pour répondre aux défis de performance des grands modèles de langage dans les tâches de conversion du langage naturel en langage SQL, nous proposons XiYan-SQL, un cadre innovant qui utilise une stratégie d'intégration multi-générateurs pour améliorer la génération de candidats. Nous introduisons M-Schema, une représentation de schéma semi-structurée pour une meilleure compréhension des structures de base de données. Pour améliorer la qualité et la diversité des requêtes SQL candidates générées, XiYan-SQL combine le potentiel remarquable de l'apprentissage en contexte (ICL) avec le contrôle précis de l'ajustement supervisé. D'une part, nous proposons une série de stratégies de formation pour affiner le modèle afin de générer des candidats de haute qualité avec diverses préférences. D'autre part, nous mettons en œuvre une méthode de sélection d'exemples basée sur la reconnaissance des entités nommées afin d'éviter de mettre trop l'accent sur les entités dans les approches ICL. Le raffineur optimise chaque élément candidat en corrigeant les erreurs logiques ou syntaxiques. Pour relever le défi de l'identification des meilleurs candidats, nous affinons un modèle de sélection pour distinguer les différences subtiles dans les requêtes SQL candidates. Les résultats expérimentaux sur plusieurs ensembles de données dialectales montrent que XiYan-SQL fait preuve d'une grande robustesse pour relever les défis dans différents scénarios. Dans l'ensemble, notre proposition XiYan-SQL atteint une précision d'exécution compétitive de 89,65% sur l'ensemble de test Spider, 69,86% sur SQL-Eval, 41,20% sur NL2GQL, et obtient 72,23% sur le benchmark de développement Bird. Le cadre améliore non seulement la qualité et la diversité des requêtes SQL, mais il est également plus performant que les approches précédentes.

Source : https://github.com/XGenerationLab/XiYan-SQL

析言GBI(XiYan-SQL):Text-to-SQL智能数据分析,轻松实现ChatBI

 

Liste des fonctions

  • dialogue en langage naturelLe langage SQL : Interroger et analyser des données en langage naturel sans avoir à maîtriser la syntaxe du langage SQL.
  • Prise en charge de plusieurs sources de donnéesSupport pour les bases de données MySQL, PostgreSQL et l'intégration de fichiers Excel.
  • Planification intelligente des tâches: Un cadre de corps multi-intelligent planifie dynamiquement l'exécution des tâches en fonction de leur complexité.
  • Visualisation intelligente des graphiquesLes résultats de l'analyse sont présentés sous forme de graphiques intelligents basés sur les caractéristiques des données.
  • Explication de la logique d'entrepriseLes fonctions d'interprétation de la logique d'entreprise sont souples et permettent aux grands modèles de comprendre les scénarios d'entreprise.
  • Gestion des tables de donnéesGestion des informations sur les tables de données pour améliorer la précision des requêtes.
  • Auto-exploitation du recueil de casOptimiser l'efficacité des modèles en guidant l'auto-apprentissage des modèles par le biais de la gestion des cas.
  • Déploiement de la sécuritéLa sécurité des données est assurée par des modèles de déploiement hybrides et dans le nuage public.

 

Utiliser l'aide

Installation et configuration

  1. S'inscrire et se connecter: AccèsDialectique GBI Site officielEnregistrez-vous et connectez-vous avec votre compte AliCloud.
  2. Créer un projetAprès vous être connecté, entrez dans la console, cliquez sur "Créer un projet", remplissez le nom et la description du projet et sélectionnez le type de source de données.
  3. Connexion à une source de donnéesSelon le type de source de données sélectionné, remplissez les informations de connexion correspondantes (telles que l'URL de la base de données, le nom d'utilisateur et le mot de passe) pour terminer la connexion à la source de données.
  4. Configuration des corps intelligentsDans les paramètres du projet, configurez la planification des tâches et la stratégie d'exécution des intelligences, et sélectionnez le modèle de corps intelligent approprié.
  5. Déploiement et testsAprès avoir terminé la configuration, cliquez sur "Déployer", le système se déploie automatiquement. Une fois le déploiement terminé, vous pouvez tester la console pour vous assurer que la configuration est correcte.

Lignes directrices pour l'utilisation

  1. requête en langage naturelLe système génère automatiquement le langage SQL et renvoie les résultats de la requête.
  2. Génération intelligente de graphiquesDans la page de résultats de la requête, cliquez sur "Générer un graphique". Le système génère automatiquement le graphique correspondant en fonction des caractéristiques des données, et les utilisateurs peuvent choisir différents types de graphiques pour l'affichage.
  3. Soutien au dialogue à plusieurs voixLe système prend en charge plusieurs cycles de dialogue, où les utilisateurs peuvent ajouter, modifier ou suivre des questions pendant le processus d'interrogation, et le système répondra de manière intelligente en fonction du contexte.
  4. Explication de la logique d'entrepriseLes utilisateurs peuvent, au cours du processus d'interrogation, ajouter des explications sur la logique commerciale afin d'aider le système à comprendre plus précisément l'intention de l'interrogation.
  5. Gestion de la bibliothèque de casLes utilisateurs peuvent ajouter, modifier et gérer des cas dans la bibliothèque de cas, en guidant le modèle à travers des cas pour l'auto-apprentissage et en améliorant la précision et l'efficacité du modèle.
  6. Gestion des tables de donnéesDans le module "Gestion des tables de données" de la console, les utilisateurs peuvent afficher et gérer les informations relatives aux tables de données, notamment la structure des tables, les informations sur les colonnes, etc.
  7. Paramètres de sécuritéDans les paramètres du projet, les utilisateurs peuvent configurer les politiques de sécurité des données, y compris l'accès au VPC, le cryptage des données, etc. pour garantir la sécurité de la transmission et du stockage des données.

problèmes courants

  • Erreur de connexion à la base de donnéesVérifier que le format de l'URL est correct, s'assurer que l'URL est une adresse accessible par le réseau public, vérifier la restriction de l'IP d'accès à la base de données, s'assurer que l'IP du réseau public du Dialect GBI figure dans la liste blanche.
  • Mauvais résultats des enquêtesLes problèmes complexes sont divisés en plusieurs problèmes simples, des représentations de tables de données et des informations sur les schémas sont ajoutées, des explications sur la logique d'entreprise sont ajoutées, des cas d'optimisation sont ajoutés.
  • Erreur de formatage de la dateIl est recommandé d'utiliser le format AAAA-MM-JJ et d'indiquer le format de la date dans la description de la colonne.
© déclaration de droits d'auteur
AiPPT

Articles connexes

Pas de commentaires

aucun
Pas de commentaires...