Kit de ferramentas do engenheiro de modelagem de linguagem grande: uma seleção de mais de 120 recursos úteis da biblioteca

Notícias sobre IAAtualizado há 3 meses Sharenet.ai
373 0
吐司AI

No campo da Inteligência Artificial, a tecnologia de Modelagem de Linguagem Grande (LLM) está mudando rapidamente e várias bibliotecas de ferramentas estão surgindo. Para ajudar os desenvolvedores a enfrentar melhor os desafios do desenvolvimento de LLM, este documento compila uma caixa de ferramentas com mais de 120 bibliotecas de LLM úteis, divididas por categorias funcionais, para que os engenheiros possam encontrá-las e aplicá-las rapidamente.

大型语言模型工程师工具箱:精选120+实用库资源

 

Navegação rápida

Para facilitar aos leitores a localização rápida dos recursos de que precisam, aqui estão os links rápidos para as bibliotecas de ferramentas de cada categoria:

Treinamento e ajuste fino do LLM🧱 Desenvolvimento de aplicativos LLM🩸 Geração de aprimoramento de recuperação LLM (RAG)
Raciocínio do LLMImplementação do serviço LLMExtração de dados do LLM
🌠 Geração de dados LLMCorpo Inteligente LLM⚖️ Avaliação do LLM
🔍 Monitoramento e controle do LLM📅 LLM Prompt Word Engineering📝 LLM Saída estruturada
🛑 Segurança do LLMModelo incorporado LLM❇️ Outros

 

Treinamento e aperfeiçoamento do LLM

nome da bibliotecadescriçõeslink (em um site)
sem preguiçaAjuste fino do LLM mais rápido com menos memória.link (em um site)
PEFTBiblioteca avançada de ajuste fino com eficiência de parâmetros.link (em um site)
TRLTreinamento usando aprendizado por reforço transformador Modelagem de linguagem.link (em um site)
TransformadoresO Transformers oferece milhares de modelos pré-treinados para executar tarefas em diferentes modalidades, como texto, visão e áudio.link (em um site)
AxoloteFerramentas projetadas para simplificar o pós-treinamento de vários modelos de IA.link (em um site)
LLMBoxUma biblioteca LLM abrangente, incluindo um pipeline de treinamento unificado e uma avaliação abrangente do modelo.link (em um site)
LitGPTTreinar e ajustar rapidamente o LLM.link (em um site)
MergooUma biblioteca para mesclar facilmente vários especialistas em LLM e treinar com eficiência o LLM mesclado.link (em um site)
Fábrica de LhamasFerramenta simples e eficiente de ajuste fino do LLM.link (em um site)
LudwigEstrutura de baixo código para criar LLMs personalizados, redes neurais e outros modelos de IA.link (em um site)
TxtinstructUma estrutura para modelos de ajuste de instruções de treinamento.link (em um site)
LaminiUma plataforma integrada de inferência e ajuste de LLM.link (em um site)
XTuringO XTuring oferece ajuste fino rápido, eficiente e simples de LLMs de código aberto, como Mistral, LLaMA, GPT-J e outros.link (em um site)
RL4LMsUma biblioteca modular de RL para ajuste fino de modelos de linguagem às preferências humanas.link (em um site)
DeepSpeedO DeepSpeed é uma biblioteca de otimização de aprendizagem profunda que torna o treinamento e a inferência distribuídos simples, eficientes e eficazes.link (em um site)
torchtuneUma biblioteca nativa do PyTorch projetada especificamente para o ajuste fino do LLM.link (em um site)
PyTorch relâmpagoUma biblioteca que fornece uma interface de alto nível para pré-treinamento e ajuste fino de LLMs.link (em um site)

 

Desenvolvimento de aplicativos LLM

fig. padrão

nome da bibliotecadescriçõeslink (em um site)
LangChainO LangChain é uma estrutura para o desenvolvimento de aplicativos orientados pelo Large Language Model (LLM).link (em um site)
Índice LlamaO LlamaIndex é a estrutura de dados para aplicativos LLM.link (em um site)
Pilha de fenoO Haystack é uma estrutura LLM de ponta a ponta que permite aos usuários criar aplicativos orientados por LLM, modelos Transformer, pesquisa vetorial e muito mais.link (em um site)
Fluxo imediatoUm conjunto de ferramentas de desenvolvimento projetado para simplificar o ciclo de desenvolvimento de ponta a ponta de aplicativos de IA baseados em LLM.link (em um site)
GriptapeUma estrutura Python modular para criar aplicativos orientados por IA.link (em um site)
TecidoO Weave é um kit de ferramentas para o desenvolvimento de aplicativos de IA generativa.link (em um site)
Pilha de lhamasCrie o aplicativo Llama.link (em um site)

Acesso múltiplo à API

nome da bibliotecadescriçõeslink (em um site)
LiteLLMUma biblioteca com mais de 100 chamadas de API do LLM no formato OpenAI.link (em um site)
Gateway de IAUm gateway de IA rápido com cercas integradas. Rotas para mais de 200 LLMs e mais de 50 cercas de IA por meio de uma API rápida e amigável.link (em um site)

roteador (computação)

nome da bibliotecadescriçõeslink (em um site)
RotaLLMEstrutura para manutenção e avaliação de roteadores LLM - Economia de custos LLM sem comprometer a qualidade Substituição direta de clientes OpenAI para roteamento de consultas mais simples para modelos mais baratos.link (em um site)

memorização

nome da bibliotecadescriçõeslink (em um site)
mem0Camada de memória para aplicativos de IA.link (em um site)
MemóriaUma camada de memória de IA com armazenamento de curto e longo prazo, clustering semântico e redução de memória opcional para aplicativos com reconhecimento de contexto.link (em um site)

interfaces

nome da bibliotecadescriçõeslink (em um site)
Fluxo luminosoUma maneira mais rápida de criar e compartilhar aplicativos de dados. O Streamlit permite que os usuários transformem scripts Python em aplicativos interativos da Web em minutos.link (em um site)
GradioCrie e compartilhe aplicativos de aprendizado de máquina incríveis, tudo em Python.link (em um site)
UI DO SDK DE IACriação de interfaces de usuário geradoras e de bate-papo.link (em um site)
AI-GradioCrie aplicativos de IA compatíveis com uma variedade de provedores de IA.link (em um site)
SimplesPacotes Python para interagir facilmente com aplicativos de bate-papo com recursos avançados e complexidade mínima de código.link (em um site)
ChainlitCrie aplicativos de IA conversacional prontos para produção em minutos.link (em um site)

código baixo

nome da bibliotecadescriçõeslink (em um site)
LangFlowO LangFlow é um criador de aplicativos de baixo código para aplicativos RAG e de IA multiagente. Ele é baseado em Python e é independente de quaisquer modelos, APIs ou bancos de dados.link (em um site)

Cache (de computação)

nome da bibliotecadescriçõeslink (em um site)
GPTCacheUma biblioteca para criar caches semânticos para consultas LLM. Reduz o custo da API LLM em 10x💰 e aumenta a velocidade em 100x. Totalmente integrada ao LangChain e ao LlamaIndex.link (em um site)

 

LLM RAG

nome da bibliotecadescriçõeslink (em um site)
FastGraph RAGA estrutura do Fast GraphRAG, simplificada e pronta para uso, foi projetada para fluxos de trabalho de recuperação interpretáveis, altamente precisos e orientados por agentes.link (em um site)
ChonkieBiblioteca de chunking RAG, leve, extremamente rápida e fácil de usar.link (em um site)
RAGCheckerUma estrutura refinada para diagnosticar o RAG.link (em um site)
RAG to RichesCrie, estenda e implemente aplicativos avançados de geração aprimorada por pesquisa.link (em um site)
Além daLLMO Beyond LLM fornece um kit de ferramentas completo para experimentação, avaliação e implantação de sistemas RAG (Retrieval Augmented Generation).link (em um site)
SQLite-VecUma extensão SQLite de pesquisa vetorial que é executada em qualquer lugar!link (em um site)
fastRAGO fastRAG é uma estrutura de pesquisa para recuperação eficiente e otimizada de pipelines de geração aprimorada, combinando LLM avançado e técnicas de recuperação de informações.link (em um site)
FlashRAGKit de ferramentas Python para pesquisa RAG eficiente.link (em um site)
LlmwareUma estrutura unificada para criar pipelines RAG empresariais usando modelos pequenos e específicos.link (em um site)
RerankersAPI unificada e leve para vários modelos de reordenação.link (em um site)
VectaraCrie o aplicativo Agentic RAG.link (em um site)

 

Raciocínio do LLM

nome da bibliotecadescriçõeslink (em um site)
Compressor LLMBiblioteca compatível com Transformers para aplicar vários algoritmos de compactação ao LLM para otimizar a implantação.link (em um site)
LightLLMEstrutura de serviço e inferência LLM baseada em Python conhecida por seu design leve, facilidade de dimensionamento e desempenho de alta velocidade.link (em um site)
vLLMMecanismo de serviço e inferência com alto rendimento e eficiência de memória para LLM.link (em um site)
torchchatExecute o PyTorch LLM localmente em servidores, desktops e dispositivos móveis.link (em um site)
TensorRT-LLMO TensorRT-LLM é uma biblioteca para otimizar a inferência do Modelo de Linguagem Grande (LLM).link (em um site)
WebLLMMecanismo de inferência LLM de alto desempenho no navegador.link (em um site)

 

Implementação do serviço LLM

nome da bibliotecadescriçõeslink (em um site)
LangcornUse a FastAPI para automatizar a manutenção de aplicativos e agentes do LangChain LLM.link (em um site)
LitServeMecanismo de serviço extremamente rápido para qualquer modelo de IA de qualquer tamanho. Ele aprimora o FastAPI com recursos como processamento em lote, streaming e dimensionamento automático de GPU.link (em um site)

 

Extração de dados do LLM

nome da bibliotecadescriçõeslink (em um site)
Crawl4AIFerramenta de rastreamento e rastreamento da Web compatível com LLM de código aberto.link (em um site)
ScrapeGraphAIUma biblioteca Python de rastreamento da Web que usa LLM e lógica de gráfico direto para criar pipelines de rastreamento para sites e documentos locais (XML, HTML, JSON, Markdown etc.).link (em um site)
DocagemO Docling analisa documentos e os exporta de forma fácil e rápida para o formato desejado.link (em um site)
Llama ParseAnalisador de documentos nativo do GenAI que pode analisar dados de documentos complexos para qualquer caso de uso de LLM posterior (RAG, agente).link (em um site)
PyMuPDF4LLMA biblioteca PyMuPDF4LLM facilita aos usuários a extração de conteúdo PDF nos formatos exigidos pelos ambientes LLM e RAG.link (em um site)
CrawleeUma biblioteca de automação de navegador e rastreador da Web.link (em um site)
MegaParseAnalisador para cada tipo de documento.link (em um site)
ExtractThinkerBiblioteca de Inteligência de Documentos para LLM.link (em um site)

 

Geração de dados LLM

nome da bibliotecadescriçõeslink (em um site)
DataDreamerO DataDreamer é uma biblioteca Python avançada e de código aberto para solicitação, geração de dados sintéticos e fluxos de trabalho de treinamento.link (em um site)
fabricanteUma estrutura flexível de código aberto para gerar conjuntos de dados usando modelos de linguagem grandes.link (em um site)
PromptwrightBiblioteca de geração de conjuntos de dados sintéticos.link (em um site)
EasyInstructUma estrutura fácil de usar para processar instruções de modelos de linguagem grandes.link (em um site)

LLM Intelligent Body (Corpo Inteligente)

nome da bibliotecadescriçõeslink (em um site)
CrewAIUma estrutura para orquestrar agentes de IA autônomos e de interpretação de papéis.link (em um site)
LangGraphConstrua o agente de linguagem elástica como um gráfico.link (em um site)
AgnoCrie agentes de IA com memória, conhecimento, ferramentas e recursos de raciocínio. Converse com eles usando uma bela interface de usuário de agente.link (em um site)
AutoGenUma estrutura de código aberto para a criação de sistemas de agentes de IA.link (em um site)
SmolagentsBiblioteca para criar agentes avançados em poucas linhas de código.link (em um site)
IA PydanticEstrutura de agente Python para criar aplicativos de nível de produção usando IA generativa.link (em um site)
gradio-toolsUma biblioteca Python para converter aplicativos Gradio em ferramentas que podem ser utilizadas por agentes baseados em LLM para concluir suas tarefas.link (em um site)
ComposiçãoConjunto de ferramentas prontas para produção para agentes de IA.link (em um site)
Agentes atômicosCriação atômica de agentes de IA.link (em um site)
MemóriasUma camada de memória de código aberto para agentes autônomos.link (em um site)
Uso do navegadorTornar o site acessível aos agentes de IA.link (em um site)
OpenWebAgentUm kit de ferramentas aberto para habilitar proxies da Web em grandes modelos de linguagem.link (em um site)
LagentUma estrutura leve para a criação de agentes baseados em LLM.link (em um site)
LazyLLMUma ferramenta de desenvolvimento com pouco código para a criação de aplicativos LLM multiagentes.link (em um site)
EnxamesUma estrutura para orquestração de multiagentes pronta para produção de nível empresarial.link (em um site)
ChatArenaO ChatArena é uma biblioteca que oferece um ambiente de jogo de linguagem multiagente e facilita a pesquisa sobre agentes autônomos de LLM e suas interações sociais.link (em um site)
EnxameExplorando uma estrutura educacional ergonômica, leve e orquestrada por vários agentes.link (em um site)
Pilha de agentesA maneira mais rápida de criar agentes de IA avançados.link (em um site)
ArqueologiaGateway de agente inteligente.link (em um site)
FluxoUm mecanismo de tarefas leve para a criação de agentes de IA.link (em um site)
AgenteOpsPython SDK para monitoramento de agentes de IA.link (em um site)
LangróideEstrutura multiagente.link (em um site)
AgentariumUma estrutura para criar e gerenciar simulações que preenchem agentes orientados por IA.link (em um site)
Upsônicoapoiar algo MCP estrutura para agentes de IA confiáveis.link (em um site)

 

Avaliação do LLM

nome da bibliotecadescriçõeslink (em um site)
RagasO Ragas é o kit de ferramentas definitivo para avaliar e otimizar aplicativos de Modelo de Linguagem Grande (LLM).link (em um site)
GiskardFerramentas de avaliação e teste de código aberto para sistemas ML e LLM.link (em um site)
DeepEvalEstrutura de avaliação do LLMlink (em um site)
LightevalUm kit de ferramentas completo para avaliação de LLMs.link (em um site)
TrulensFerramentas de avaliação e rastreamento para experimentos LLMlink (em um site)
PromptBenchUma estrutura de avaliação unificada para modelagem de linguagem em larga escala.link (em um site)
LangTestFornecimento de modelos de linguagem seguros e válidos. Mais de 60 tipos de teste para comparar modelos de LLM e NLP em termos de precisão, viés, imparcialidade, robustez e muito mais.link (em um site)
EvalPlusEstrutura de avaliação rigorosa para LLM4Code.link (em um site)
FastChatUma plataforma aberta para treinamento, atendimento e avaliação de chatbots com base em grandes modelos de linguagem.link (em um site)
juízesUm pequeno grupo de juízes LLM.link (em um site)
AvaliaçõesEvals é uma estrutura para avaliar sistemas de LLM e LLM, bem como comparar registros de código aberto.link (em um site)
AgenteEvalsAvaliadores e utilitários para avaliar o desempenho do agente.link (em um site)
LLMBoxUma biblioteca LLM abrangente, incluindo um pipeline de treinamento unificado e uma avaliação abrangente do modelo.link (em um site)
OpikUma plataforma de desenvolvimento de LLM de ponta a ponta e de código aberto que também inclui avaliação de LLM.link (em um site)

 

Monitoramento do LLM

nome da bibliotecadescriçõeslink (em um site)
MLflowUma plataforma MLOps/LLMOps de código aberto de ponta a ponta para rastrear, avaliar e monitorar aplicativos LLM.link (em um site)
OpikUma plataforma de desenvolvimento de LLM de código aberto de ponta a ponta que também inclui monitoramento de LLM.link (em um site)
LangSmithFornece ferramentas para documentar, monitorar e aprimorar os aplicativos LLM.link (em um site)
Pesos e vieses (W&B)A W&B oferece funcionalidade para rastrear o desempenho do LLM.link (em um site)
HeliconePlataforma de observabilidade LLM de código aberto para desenvolvedores. Integração de uma linha para monitoramento, métricas, avaliação, rastreamento de agentes, gerenciamento de dicas, playgrounds e muito mais.link (em um site)
EvidentementeUma estrutura de observabilidade de ML e LLM de código aberto.link (em um site)
FênixUma plataforma de observabilidade de IA de código aberto projetada para experimentação, avaliação e solução de problemas.link (em um site)
ObservadoresUma biblioteca leve para observabilidade de IA.link (em um site)

 

LLM Engenharia de palavras-chave

nome da bibliotecadescriçõeslink (em um site)
PCToolkitKit de ferramentas de compactação de dicas plug-and-play unificado para modelos de idiomas grandes.link (em um site)
Contexto seletivoO Selective Context comprime os prompts e o contexto do usuário para permitir que o LLM (por exemplo, ChatGPT) processe duas vezes mais conteúdo.link (em um site)
LLMLinguaBiblioteca para compactar dicas para acelerar o raciocínio do LLM.link (em um site)
melhorpromptUm conjunto para testar os prompts do LLM antes de colocá-los no ambiente de produção.link (em um site)
PromptifyResolva problemas de PLN com o LLM e gere facilmente diferentes prompts de tarefas de PLN para modelos generativos populares, como GPT, PaLM, etc., com o Promptify.link (em um site)
Origem do promptO PromptSource é um kit de ferramentas para criar, compartilhar e usar prompts de linguagem natural.link (em um site)
DSPyO DSPy é uma estrutura de código aberto para programar (não solicitar) modelos de linguagem.link (em um site)
Py-priomptAbrir a biblioteca de design.link (em um site)
PromptimizerDicas para otimizar a biblioteca.link (em um site)

 

Saída estruturada do LLM

nome da bibliotecadescriçõeslink (em um site)
InstrutorBiblioteca Python para processamento de saída estruturada de modelos de linguagem grandes (LLMs). Criada com base no Pydantic, ela oferece uma API simples, transparente e fácil de usar.link (em um site)
XGrammarUma biblioteca de código aberto para geração de estruturas eficientes, flexíveis e portáteis.link (em um site)
EsboçosGeração avançada de texto (estruturado)link (em um site)
OrientaçãoA orientação é um paradigma de programação válido usado para orientar o modelo de linguagem.link (em um site)
LMQLUma linguagem para bootstrapping de restrições e programação LLM eficiente.link (em um site)
JsonformerUm método infalível para gerar JSON estruturado a partir de modelos de linguagem.link (em um site)

 

Segurança LLM

nome da bibliotecadescriçõeslink (em um site)
JailbreakEvalUma coleção de avaliadores automatizados para avaliar tentativas de jailbreak.link (em um site)
EasyJailbreakUma estrutura Python fácil de usar para gerar dicas de jailbreak adversárias.link (em um site)
Grades de proteçãoAdicionando proteções a modelos de linguagem grandes.link (em um site)
Guarda do LLMLLM Interactive Security Toolkit.link (em um site)
AuditoriaNLGAuditNLG é uma biblioteca de código aberto que pode ajudar a reduzir os riscos associados ao uso de sistemas de IA generativos para idiomas.link (em um site)
Guardrails NeMoO NeMo Guardrails é um kit de ferramentas de código aberto para adicionar facilmente guardrails programáveis a sistemas de diálogo baseados em LLM.link (em um site)
GarakScanner de vulnerabilidade LLMlink (em um site)

 

Modelo incorporado do LLM

nome da bibliotecadescriçõeslink (em um site)
Sentença-TransformadoresModelo avançado de incorporação de textolink (em um site)
Model2VecModelos avançados e rápidos de incorporação estáticalink (em um site)
Inferência de incorporação de textoSolução de inferência de alta velocidade para modelos de incorporação de texto. O TEI permite a extração de alto desempenho para os modelos mais populares, incluindo FlagEmbedding, Ember, GTE e E5.link (em um site)

 

O resto

nome da bibliotecadescriçõeslink (em um site)
Texto MachinaUma estrutura Python modular e extensível projetada para ajudar a criar conjuntos de dados imparciais e de alta qualidade para a criação de modelos robustos para tarefas relacionadas à MGT, como detecção, atribuição e detecção de limites.link (em um site)
Raciocinadores LLMUma biblioteca para raciocínio avançado de modelos de linguagem em grande escala.link (em um site)
EasyEditUma estrutura de edição de conhecimento fácil de usar para modelos de linguagem em grande escala.link (em um site)
CódigoTFCodeTF: uma biblioteca Transformer completa para LLM de código avançado.link (em um site)
espaço-llmEsse pacote integra um Modelo de Linguagem Grande (LLM) ao spaCy com um sistema modular para prototipagem rápida e sugestões, e transforma respostas não estruturadas em resultados robustos para uma variedade de tarefas de PNL.link (em um site)
pandas-aiConverse com o banco de dados do usuário (SQL, CSV, pandas, polars, MongoDB, NoSQL, etc.).link (em um site)
Ferramenta de Transparência do LLMUm kit de ferramentas interativo de código aberto para analisar o funcionamento interno dos modelos de linguagem baseados no Transformer.link (em um site)
VannaConverse com os bancos de dados SQL dos seus usuários. Geração precisa de texto para SQL usando o LLM do RAG.link (em um site)
kit de mesclagemFerramentas para mesclar modelos de linguagem pré-treinados em larga escala.link (em um site)
MarkLLMUm kit de ferramentas de código aberto para marca d'água LLM.link (em um site)
LLMSanitizeUma biblioteca de código aberto para detecção de contaminação em conjuntos de dados de NLP e modelos de linguagem grandes (LLMs).link (em um site)
AnotaçõesFaça anotações automáticas em documentos usando o LLM.link (em um site)
Raciocinador LLMQue qualquer LLM como o OpenAI o1 e DeepSeek Pense como R1.link (em um site)
© declaração de direitos autorais
AiPPT

Related posts

Sem comentários

nenhum
Nenhum comentário...