Crawl4LLM:为LLM预训练提供的高效网页爬取工具

Crawl4LLM: una herramienta eficaz de rastreo web para el preentrenamiento de LLM

Introducción exhaustiva Crawl4LLM es un proyecto de código abierto desarrollado conjuntamente por la Universidad de Tsinghua y la Universidad Carnegie Mellon, centrado en optimizar la eficiencia del rastreo web para el preentrenamiento de grandes modelos (LLM). Reduce significativamente el rastreo ineficaz mediante la selección inteligente de datos web de alta calidad, afirmando ser capaz de rastrear originalmente 1...
hace 4 meses
06100
Graphiti:动态知识图谱构建和查询工具(具有时间感知的长记忆方案)

Graphiti: herramienta dinámica de construcción y consulta de grafos de conocimiento (programa de memoria larga consciente del tiempo)

综合介绍 Graphiti是由 getzep 开发的一款用于构建和查询动态、时间感知的知识图谱的工具。它能够表示实体之间复杂且不断变化的关系,并通过时间、全文、语义和图算法等多种方法进行查询。Grap...
hace 4 meses
07800