CARREGAMENTO

Base de conhecimento de IA

Total de 207 artigos

Informações sobre o curso Comandos do utilitário de IA Ferramentas de IA mais recentes Base de conhecimento de IA Notícias sobre IA Tutoriais práticos de IA Respostas da IA

organizar em ordem

postagem atualização passar por cima elogios

系统掌握提示词工程——从基础到进阶（阅读时间2小时起）

Domínio sistemático da engenharia de palavras-chave - do básico ao avançado (tempo de leitura de 2 horas)

导读本文档旨在通过一系列提示词示例（部分），帮助读者快速理解并掌握提示词工程的核心概念与应用。这些示例均源自于一篇关于提示工程技术系统综述的学术论文（《The Prompt Report: A Sy...

Base de conhecimento de IA

4 meses atrás

06290

Tokenization(分词标记化)

Tokenização

各位好，今天我们要探讨大型语言模型（LLM）中的分词技术。遗憾的是，分词在当前顶尖的LLM中是一个比较复杂且棘手的部分，但理解它的某些细节非常必要，因为很多人将LLM的一些缺点归咎于神经网络或其他显得...

Base de conhecimento de IA

4 meses atrás

01.5K0

深入解读 Titans：长时记忆与高效序列建模的融合之路

Uma análise aprofundada dos Titãs: o caminho para a convergência da memória de longo prazo e a modelagem eficiente de sequências

《Titans: Learning to Memorize at Test Time》原文：https://arxiv.org/pdf/2501.00663v1 Titans 架构非官方实现：htt...

Base de conhecimento de IA

4 meses atrás

06710

LLM OCR 的局限性：光鲜外表下的文档解析难题

Limitações do LLM OCR: Desafios de análise de documentos sob o glamour

对于任何需要检索增强生成 (RAG) 系统的应用来说，将海量 PDF 文档变成机器能读懂的文本块（也就是 “PDF 分块”）都是个让人头疼的大难题。市面上既有开源的方案，也有商业化的产品，但说实话...

Base de conhecimento de IA

4 meses atrás

07750

OpenAI 函数调用（Function calling）

Chamada de função OpenAI

OpenAI Function calling V2 特点 Function calling V2 的核心目标是赋予 OpenAI 模型与外部世界交互的能力，主要体现在以下两个核心功能：数据获取 ...

Base de conhecimento de IA

4 meses atrás

07640

多样本(示例)越狱攻击

Ataque de jailbreak do Multibook (exemplo)

研究人员研究了一种“越狱攻击”技术——这种方法可以被用来绕过大语言模型 (LLM) 开发者设置的安全护栏。这项技术被称为“多样本越狱攻击”，在 Anthropic 自身模型以及其他 AI 公司生产的模...

Base de conhecimento de IA

4 meses atrás

06260

ChatGPT自定义指令常见问题解答

Perguntas frequentes sobre o comando personalizado ChatGPT

概述自定义指令功能让您可以分享您希望ChatGPT在回应中考虑的任何信息。您的指令将应用于新的对话中。可用性所有终端网络、iOS 和 Android 您的数据的使用方式您可以随时为...

Base de conhecimento de IA

4 meses atrás

01.2K0

揭示 AI 过滤器中的安全漏洞：使用字符代码绕过限制的深入研究

Descobrindo falhas de segurança em filtros de IA: um estudo aprofundado do uso de código de caracteres para contornar restrições

介绍和许多其他人一样，在过去几天里，我的新闻推送充斥着关于中国制造的 DeepSeek-R1 大语言模型的新闻、赞扬、抱怨和猜测，该模型于上周发布。该模型本身正被拿来与 OpenAI、Meta 等公...

Base de conhecimento de IA # prompt jailbreak

4 meses atrás

08620

OpenAI o3-mini 系统说明书（中文）

Manual do sistema OpenAI o3-mini (chinês)

原文：https://cdn.openai.com/o3-mini-system-card.pdf 1 引言 OpenAI o 模型系列使用大规模强化学习进行训练，以使用思维链进行推理。这些先进的推理...

Base de conhecimento de IA

4 meses atrás

09710

Chinchilla 时刻与 o3 时代：大语言模型“规模定律”的演进之路

O momento Chinchilla e o momento o3: a evolução da lei de escala para grandes modelos de linguagem

文章速读文章全面而深入地探讨了大语言模型 (LLM) 规模定律（缩放法则/Scaling Law）的前世今生，以及 AI 研究的未来方向。作者 Cameron R. Wolfe 以清晰的逻辑和丰富...

Base de conhecimento de IA

4 meses atrás

08810

智能代理检索增强生成：Agentic RAG 技术综述

Intelligent Agentic Retrieval Enhanced Generation: uma visão geral da tecnologia Agentic RAG

摘要大型语言模型（LLMs），如OpenAI的GPT-4、Google的PaLM和Meta的LLaMA，通过实现类人文本生成和自然语言理解，极大地改变了人工智能（AI）。然而，它们对静态训练数据的依...

Base de conhecimento de IA

4 meses atrás

08880

LangGraph：基于有向无环图拓扑的AI Agent构建与执行框架

LangGraph: uma estrutura para construção e execução de agentes de IA com base na topologia de gráficos acíclicos direcionados

人工智能（AI）是一个迅速发展的领域。语言模型已经发展到能够让AI Agent执行复杂任务和做出复杂决策。然而，随着这些Agent的技能不断提升，支持它们的基础设施难以跟上。 LangGraph，这是...

Base de conhecimento de IA

4 meses atrás

01.2K0

一文说清楚知识蒸馏（Distillation）：让“小模型”也能拥有“大智慧”

Um artigo claro sobre Destilação de Conhecimento (Destilação): permitir que o "modelo pequeno" também possa ter "grande sabedoria".

A destilação de conhecimento é uma técnica de aprendizado de máquina que visa transferir o aprendizado de um modelo grande pré-treinado (ou seja, um "modelo de professor") para um "modelo de aluno" menor. As técnicas de destilação podem nos ajudar a desenvolver modelos generativos mais leves para diálogo inteligente, criação de conteúdo e outras áreas. Recentemente ...

Base de conhecimento de IA

4 meses atrás

01.1K0

什么是 Transformer？

O que é Transformer?

O Transformer é uma arquitetura de modelo de aprendizagem profunda para processamento de linguagem natural (NLP), proposta por Vaswani et al. em 2017. Ele é usado principalmente para processar tarefas de sequência a sequência, como tradução automática, geração de texto etc. Simples...

Base de conhecimento de IA

4 meses atrás

09490

CoRAG：利用MCTS（蒙特卡洛树）动态链式 RAG 模型

CoRAG: modelagem dinâmica de RAG encadeada usando MCTS (Monte Carlo Trees)

Resumo das principais contribuições do CORAG O CORAG (Cost-Constrained Retrieval Optimization for Retrieval-Augmented Generation) é um programa...

Base de conhecimento de IA

4 meses atrás

09160

大模型参数量如何计算？7B、13B、65B 究竟代表什么？

Como calcular o número de parâmetros de um modelo grande e o que significam 7B, 13B e 65B?

最近，许多从事大模型训练和推理的朋友都在讨论模型参数量和模型大小之间的关系。例如，著名的羊驼系列 LLaMA 大模型，就包含了 LLaMA-7B、LLaMA-13B、LLaMA-33B 和 LLaMA...

Base de conhecimento de IA

4 meses atrás

01.3K0

PDL：声明式提示词编程语言

PDL: linguagem de programação declarativa de palavras solicitadas

Resumo Os Modelos de Linguagem Grande (LLMs) despertaram grande interesse em todo o mundo, possibilitando muitos aplicativos de IA que antes eram ilusórios. Os LLMs são controlados por solicitações textuais altamente expressivas e retornam respostas textuais. No entanto, essa entrada e saída de texto não estruturado faz com que os aplicativos baseados em LLM...

Base de conhecimento de IA

4 meses atrás

01.1K0

CLOB：仅使用提示词让大语言模型持续学习一系列任务

CLOB: Aprendizado contínuo de uma série de tarefas por um modelo de linguagem grande usando apenas palavras-chave

原文：https://arxiv.org/pdf/2412.15479 解读：此文章本身创新不多，应用意义也不大。不过，让我想起很久很久以前阅读的三篇高含金量的文章，阅读此文结合之前的三篇文章，希望给...

Base de conhecimento de IA

4 meses atrás

07420

CoD：密度链

CoD: Chain of Density (Cadeia de densidade)

原文：https://arxiv.org/pdf/2309.04269 速读：《从稀疏到密集：使用链式密度提示的GPT-4摘要生成》收录到：总结知识常用prompts 摘要在自动文本摘要中，确...

Base de conhecimento de IA

4 meses atrás

07240

Português do Brasil