Tirer parti de STORM : construction d'un article de type Wikipedia pour la rédaction basée sur la recherche Internet

吐司AI

Thèse :https://arxiv.org/abs/2402.14207

 

Pouvons-nous enseigner aux titulaires d'une maîtrise en droit à rédiger de longs articles à partir de zéro, en s'appuyant sur des sources fiables ?
Les éditeurs de Wikipédia pensent-ils que cela les aidera ?
📣 Annonce de STORM, un système de rédaction d'articles de type Wikipédia basé sur des recherches Internet. J'utilise désormais STORM dans mes recherches quotidiennes !

 

 

Générer de longs articles avec des citations est difficile à faire et à évaluer !

Nous procédons en deux étapes :
1️⃣ Pré-rédaction au cours de laquelle le système collecte des références et génère un plan.
2️⃣ rédaction, dans laquelle le système génère l'article final avec des citations.

 

利用STORM:构建基于互联网搜索编写维基百科式文章

 

La "pré-écriture" consiste à faire des recherches sur un sujet à partir de zéro.
Cette tâche est difficile, même pour les experts humains. Demander directement aux modèles linguistiques de générer des questions ne fonctionne pas ! Ces problèmes manquent de profondeur et ont une portée limitée.
STORM vise à enseigner la modélisation linguistique **pose de bonnes questions**.

 

利用STORM:构建基于互联网搜索编写维基百科式文章

 

STORM améliore le questionnement en découvrant automatiquement des points de vue sur des sujets de recherche et en ajoutant des points de vue aux questions. Il simule également des dialogues de recherche d'informations afin d'encourager des questions de suivi souvent plus approfondies.

 

利用STORM:构建基于互联网搜索编写维基百科式文章

 

Nous avons construit FreshWiki pour réduire les fuites de données dans les données d'entraînement LM pour l'évaluation.
Pour mesurer la qualité, nous avons introduit le rappel souple des titres et le rappel des entités des titres. L'évaluation des grandes lignes facilite la pré-écriture de méthodes de prototypage.
STORM est supérieur à une ligne de base RAG bien conçue !

 

利用STORM:构建基于互联网搜索编写维基百科式文章

 

Lors de la phase finale de rédaction, STORM génère un texte avec des citations et rédige l'article complet section par section.

laisser (à qqn) STORM Les articles générés sont favorisés par les métriques automatiques *et* les éditeurs expérimentés de Wikipedia !

 

利用STORM:构建基于互联网搜索编写维基百科式文章

 

Cet écrit illustratif doit toujours être ancré dans les faits.
Nous avons évalué la qualité des citations et demandé aux éditeurs de Wikipédia d'évaluer la vérifiabilité. Nous avons constaté que le principal défi consiste à détourner la conversation des illusions factuelles largement débattues.
Cela nécessite des recherches qui vont au-delà de la vérification des faits !

 

利用STORM:构建基于互联网搜索编写维基百科式文章

 

Nous avons également interrogé les éditeurs de Wikipédia sur l'utilité perçue de STORM. Il est intéressant de noter que tous les participants ont reconnu que STORM était utile dans leur phase de pré-écriture. En outre, j'utilise moi-même STORM pour approfondir les concepts de ma recherche (si vous n'avez pas encore vu notre vidéo de démonstration, cliquez ici).

 

利用STORM:构建基于互联网搜索编写维基百科式文章

 

Il convient de noter que STORM est une filière de gestion des connaissances bien conçue, et non un conseil ou un modèle unique.
Nous utilisons DSPy pour construire STORM, qui offre une modularité très soignée - ce qui nous permet de continuer à étendre notre travail sans nous perdre dans un grand nombre de fichiers d'indices.

© déclaration de droits d'auteur
AiPPT

Articles connexes

Pas de commentaires

aucun
Pas de commentaires...