CARGA

Base de conocimientos de IA

共 207 篇文章

Información sobre el curso Comandos de utilidad de AI Últimas herramientas de IA Base de conocimientos de IA Noticias AI Tutoriales prácticos sobre IA AI Respuestas

ordenar

Correo electrónico:actualización hojear felicitaciones

CAG：比RAG快40倍的缓存增强生成方法

CAG：比RAG快40倍的缓存增强生成方法

比RAG(检索增强生成)快40倍的CAG(缓存增强生成)。CAG彻底改变了知识获取方式：不再是实时检索外部数据，而是预先将所有知识加载到模型上下文中。这就像是把一个巨大的图书馆浓缩成了一本随身携带的工...

Base de conocimientos de IA

hace 5 meses

01.1K0

谷歌Agents与基础应用白皮书（中文版）

谷歌Agents与基础应用白皮书（中文版）

作者：Julia Wiesinger，Patrick Marlow和 Vladimir Vuskovic 原文：https://www.kaggle.com/whitepaper-agents 目...

Base de conocimientos de IA

hace 5 meses

01.6K0

2023年老文回顾：RAG 系统构建流程与评估指南

2023年老文回顾：RAG 系统构建流程与评估指南

检索增强生成（Retrieval Augmented Generation，RAG）正在成为大语言模型（LLM）和向量数据库最受欢迎的应用之一。RAG 是通过从向量数据库（例如 Weaviate）检索...

Base de conocimientos de IA

hace 5 meses

08630

走近多智能体系统（MAS）：协同合作的 AI 世界

走近多智能体系统（MAS）：协同合作的 AI 世界

多智能体系统 (Multi-Agent System, MAS) 是一个由多个交互的智能体 (Intelligent Agent) 组成的计算系统。多智能体系统可用于解决单个智能体或单体系统难以解决或...

Base de conocimientos de IA

hace 3 meses

04710

一文带你了解RAG(检索增强生成)，概念理论介绍+ 代码实操

一文带你了解RAG(检索增强生成)，概念理论介绍+ 代码实操

一、LLMs 已经具备了较强能力了，为什么还需要 RAG(检索增强生成)? 尽管 LLM 已展现出显著的能力，但以下几个挑战依然值得关注：幻觉问题：LLM 采用基于统计的概率方法逐词生成文本，这一机...

Base de conocimientos de IA

hace 5 meses

09460

OpenAI-o3 与 Monte-Carlo 思想

OpenAI-o3 与 Monte-Carlo 思想

o3 来了，分享一些个人的浅见。关于 Test-time Scaling Law 的进展，比我们想象中的要快得多。但我想说的是，这条路其实有些曲折——它是 OpenAI 在追求 AGI 的道路上，采取...

Base de conocimientos de IA

hace 5 meses

08600

如何为RAG应用选择最佳Embedding模型

如何为RAG应用选择最佳Embedding模型

向量Embedding是目前检索增强生成（RAG）应用程序的核心。它们捕获数据对象（如文本，图像等）的语义信息，并以数字数组表示。在时下的生成式AI应用中，这些向量Embedding通常由Embedd...

Base de conocimientos de IA

hace 5 meses

09960

万字长文讲透 RAG 在DB-GPT实际落地场景中的优化

万字长文讲透 RAG 在DB-GPT实际落地场景中的优化

前言在过去两年中，检索增强生成（RAG，Retrieval-Augmented Generation）技术逐渐成为提升智能体的核心组成部分。通过结合检索与生成的双重能力，RAG能够引入外部知识，从而...

Base de conocimientos de IA

hace 5 meses

09120

2025年值得入坑的 AI Agent 五大框架

2025年值得入坑的 AI Agent 五大框架

Agent 目前我见到的最多的翻译是“智能体”，但是直译是“代理”。那 Agentic 又要翻译成什么呢？我感觉“代理型”这样的词更合适。所以为了不让读者混淆，我在本文直接用英文表示。随着 ...

Base de conocimientos de IA

hace 5 meses

02.1K0

朴素、有效的RAG检索策略：稀疏+密集混合检索并重排，并利用“提示缓存”为文本块生成整体文档相关的上下文

朴素、有效的RAG检索策略：稀疏+密集混合检索并重排，并利用“提示缓存”为文本块生成整体文档相关的上下文

为了让 AI 模型在特定场景中发挥作用，它通常需要访问背景知识。例如，客户支持聊天机器人需要了解其服务的具体业务，而法律分析机器人需要掌握大量的过往案例。开发者通常使用检索增强生成（Retrieva...

Base de conocimientos de IA # Recuperación de conocimientos y marco RAG

hace 5 meses

09880

小白也能看懂的大模型微调知识点

小白也能看懂的大模型微调知识点

大模型微调全流程建议在微调过程中严格按照以上流程执行，避免跳步，否则可能导致无效劳动。比如，如果没有充分构建数据集，最终发现微调模型效果不佳是数据集质量的问题，那么前期的努力将付诸东流，事倍功半...

Base de conocimientos de IA

hace 5 meses

09080

万字长文梳理基于LLM的Text-to-SQL发展进程

万字长文梳理基于LLM的Text-to-SQL发展进程

OlaChat AI数智助手万字长文深度解析，带你了解Text-to-SQL技术的前世今生。论文：Next-Generation Database Interfaces: A Survey of L...

Base de conocimientos de IA

hace 5 meses

09080

Late Chunking×Milvus：如何提高RAG准确率

Late Chunking×Milvus：如何提高RAG准确率

01.背景在RAG应用开发中，第一步就是对于文档进行chunking（分块），高效的文档分块，可以有效的提高后续的召回内容的准确性。而对于如何高效的分块是个讨论的热点，有诸如固定大小分块，随机大小分...

Base de conocimientos de IA

hace 6 meses

09980

Anthropic总结构建高效智能体简单且有效的方法

Anthropic总结构建高效智能体简单且有效的方法

在过去的一年里，我们与多个行业中构建大语言模型 (LLM) 代理的团队合作。始终发现，最成功的实现并未使用复杂的框架或专用库，而是通过简单、可组合的模式构建完成。在这篇文章中，我们将分享与客户合作以...

Base de conocimientos de IA

hace 4 meses

01.4K0

多为来自Anthropic的专家关于Prompt Engineering的讨论

多为来自Anthropic的专家关于Prompt Engineering的讨论

AI总结概述 AI 提示工程的深入探讨，通过一个圆桌会议的形式，多位来自 Anthropic 的专家从研究、消费和企业等不同角度分享了他们对提示工程的理解和实践经验。文章详细阐述了提示工程的定义...

Base de conocimientos de IA

hace 6 meses

09220

Scaling Test-Time Compute：向量模型上的思维链

Scaling Test-Time Compute：向量模型上的思维链

自从 OpenAI 发布了 o1 模型后，Scaling Test-Time Compute（扩展推理时计算）就成了 AI 圈子里最火爆的话题之一。简单来说，与其在预训练或后训练阶段疯狂堆算力，不如在...

Base de conocimientos de IA

hace 6 meses

01.5K0

2024年度RAG清单，RAG应用策略100+

2024年度RAG清单，RAG应用策略100+

回顾2024，大模型日新月异，智能体百家争鸣。作为AI应用的重要组成部分，RAG也是“群雄逐鹿，诸侯并起”。年初ModularRAG持续升温、GraphRAG大放异彩，年中开源工具如火如荼、知识图...

Base de conocimientos de IA

hace 6 meses

01.3K0

Best-of-N 越狱法：对输入内容进行简单的随机变形并反复尝试，就能让主流 AI 系统突破安全限制产生有害回应

Best-of-N Jailbreak: una simple transformación aleatoria de la entrada y repetidos intentos de conseguir que los sistemas de IA dominantes se salten las restricciones de seguridad para producir respuestas dañinas.

近年来，随着生成式 AI（Generative AI）和大语言模型（LLM）的迅速发展，其安全性和可靠性问题引起了广泛关注。一项最新研究发现了一种被称为 Best-of-N 越狱法（简称 BoN）的...

Base de conocimientos de IA

hace 4 meses

01K0

卷起来了！长文本向量模型分块策略大比拼

卷起来了！长文本向量模型分块策略大比拼

长文本向量模型能够将十页长的文本编码为单个向量，听起来很强大，但真的实用吗？很多人觉得... 未必。直接用行不行？该不该分块？怎么分才最高效？本文将带你深入探讨长文本向量模型的不同分块策略，分析利...

Base de conocimientos de IA

hace 6 meses

08970

Más información