Corrige cadeias de caracteres JSON inválidas e resolve possíveis erros de formatação em dados JSON gerados por LLMs.
Introdução geral
Um módulo para corrigir arquivos JSON inválidos, especialmente para analisar dados JSON incorretos gerados por LLMs (Large Language Models). O módulo corrige erros comuns de sintaxe JSON, como aspas ausentes, vírgulas incorretas, caracteres sem escape e pares de valores-chave incompletos. Ele também completa automaticamente os valores JSON ausentes para garantir a validade dos dados.
Principais recursos.
Corrigir erros de sintaxe de JSON, como aspas ausentes, vírgulas mal colocadas, caracteres sem escape, etc.
Correção de matrizes e objetos JSON formatados incorretamente
Preenchimento automático de valores JSON ausentes
Fornece alternativas para json.loads() e json.load().
Versões de idiomas
Versão do Python: https://github.com/mangiucugna/json_repair
Versão do texto: https://github.com/josdejong/jsonrepair
Versão Go: https://github.com/RealAlexandreAI/json-repair
Versão do Ruby: https://github.com/sashazykov/json-repair-rb
instruções
- Corrigir erros de sintaxe de JSON::
- Aspas ausentes: adiciona automaticamente aspas ausentes para garantir que as chaves e os valores sejam referenciados corretamente.
- Vírgulas incorretas: corrige vírgulas redundantes ou ausentes para garantir a integridade da estrutura JSON.
- Caracteres não escapados: escapa automaticamente caracteres especiais para garantir a validade da cadeia de caracteres JSON.
- Pares de valores-chave incompletos: completa as chaves ou os valores ausentes para garantir a integridade de cada par de valores-chave.
- Correção de matrizes e objetos JSON::
- Matrizes/objetos incompletos: corrija adicionando os elementos necessários (por exemplo, vírgulas, colchetes) ou valores padrão (por exemplo, null, string vazia).
- Tratamento de dados que contêm caracteres adicionais não JSON: limpe comentários ou caracteres colocados incorretamente para manter uma estrutura válida.
- Preenchimento automático de valores JSON ausentes::
- Preencher automaticamente os campos JSON com valores padrão sensatos (por exemplo, cadeia de caracteres vazia ou nula) para garantir a validade dos dados.
- Limpeza de caracteres não JSON::
- Trata os dados que contêm caracteres adicionais não JSON, como comentários ou caracteres colocados incorretamente, mantendo uma estrutura válida.
© declaração de direitos autorais
O artigo é protegido por direitos autorais e não deve ser reproduzido sem permissão.
Artigos relacionados
Nenhum comentário...