LOADING

AI知识库

共 207 篇文章

课程资料 AI实用指令最新AI工具 AI知识库 AI新闻 AI实操教程 AI答疑

排序

发布更新浏览点赞

CAG：比RAG快40倍的缓存增强生成方法

CAG：比RAG快40倍的缓存增强生成方法

比RAG(检索增强生成)快40倍的CAG(缓存增强生成)。CAG彻底改变了知识获取方式：不再是实时检索外部数据，而是预先将所有知识加载到模型上下文中。这就像是把一个巨大的图书馆浓缩成了一本随身携带的工...

5个月前

01.1K0

谷歌Agents与基础应用白皮书（中文版）

谷歌Agents与基础应用白皮书（中文版）

作者：Julia Wiesinger，Patrick Marlow和 Vladimir Vuskovic 原文：https://www.kaggle.com/whitepaper-agents 目...

5个月前

01.6K0

2023年老文回顾：RAG 系统构建流程与评估指南

2023年老文回顾：RAG 系统构建流程与评估指南

检索增强生成（Retrieval Augmented Generation，RAG）正在成为大语言模型（LLM）和向量数据库最受欢迎的应用之一。RAG 是通过从向量数据库（例如 Weaviate）检索...

5个月前

08610

走近多智能体系统（MAS）：协同合作的 AI 世界

走近多智能体系统（MAS）：协同合作的 AI 世界

多智能体系统 (Multi-Agent System, MAS) 是一个由多个交互的智能体 (Intelligent Agent) 组成的计算系统。多智能体系统可用于解决单个智能体或单体系统难以解决或...

3个月前

04680

一文带你了解RAG(检索增强生成)，概念理论介绍+ 代码实操

一文带你了解RAG(检索增强生成)，概念理论介绍+ 代码实操

一、LLMs 已经具备了较强能力了，为什么还需要 RAG(检索增强生成)? 尽管 LLM 已展现出显著的能力，但以下几个挑战依然值得关注：幻觉问题：LLM 采用基于统计的概率方法逐词生成文本，这一机...

5个月前

09440

OpenAI-o3 与 Monte-Carlo 思想

OpenAI-o3 与 Monte-Carlo 思想

o3 来了，分享一些个人的浅见。关于 Test-time Scaling Law 的进展，比我们想象中的要快得多。但我想说的是，这条路其实有些曲折——它是 OpenAI 在追求 AGI 的道路上，采取...

5个月前

08580

如何为RAG应用选择最佳Embedding模型

如何为RAG应用选择最佳Embedding模型

向量Embedding是目前检索增强生成（RAG）应用程序的核心。它们捕获数据对象（如文本，图像等）的语义信息，并以数字数组表示。在时下的生成式AI应用中，这些向量Embedding通常由Embedd...

5个月前

09960

万字长文讲透 RAG 在DB-GPT实际落地场景中的优化

万字长文讲透 RAG 在DB-GPT实际落地场景中的优化

前言在过去两年中，检索增强生成（RAG，Retrieval-Augmented Generation）技术逐渐成为提升智能体的核心组成部分。通过结合检索与生成的双重能力，RAG能够引入外部知识，从而...

5个月前

09080

2025年值得入坑的 AI Agent 五大框架

2025年值得入坑的 AI Agent 五大框架

Agent 目前我见到的最多的翻译是“智能体”，但是直译是“代理”。那 Agentic 又要翻译成什么呢？我感觉“代理型”这样的词更合适。所以为了不让读者混淆，我在本文直接用英文表示。随着 ...

5个月前

02K0

朴素、有效的RAG检索策略：稀疏+密集混合检索并重排，并利用“提示缓存”为文本块生成整体文档相关的上下文

朴素、有效的RAG检索策略：稀疏+密集混合检索并重排，并利用“提示缓存”为文本块生成整体文档相关的上下文

为了让 AI 模型在特定场景中发挥作用，它通常需要访问背景知识。例如，客户支持聊天机器人需要了解其服务的具体业务，而法律分析机器人需要掌握大量的过往案例。开发者通常使用检索增强生成（Retrieva...

AI知识库 # 知识检索与RAG框架

5个月前

09860

小白也能看懂的大模型微调知识点

小白也能看懂的大模型微调知识点

大模型微调全流程建议在微调过程中严格按照以上流程执行，避免跳步，否则可能导致无效劳动。比如，如果没有充分构建数据集，最终发现微调模型效果不佳是数据集质量的问题，那么前期的努力将付诸东流，事倍功半...

5个月前

09060

万字长文梳理基于LLM的Text-to-SQL发展进程

万字长文梳理基于LLM的Text-to-SQL发展进程

OlaChat AI数智助手万字长文深度解析，带你了解Text-to-SQL技术的前世今生。论文：Next-Generation Database Interfaces: A Survey of L...

5个月前

09030

Late Chunking×Milvus：如何提高RAG准确率

Late Chunking×Milvus：如何提高RAG准确率

01.背景在RAG应用开发中，第一步就是对于文档进行chunking（分块），高效的文档分块，可以有效的提高后续的召回内容的准确性。而对于如何高效的分块是个讨论的热点，有诸如固定大小分块，随机大小分...

5个月前

09960

Anthropic总结构建高效智能体简单且有效的方法

Anthropic总结构建高效智能体简单且有效的方法

在过去的一年里，我们与多个行业中构建大语言模型 (LLM) 代理的团队合作。始终发现，最成功的实现并未使用复杂的框架或专用库，而是通过简单、可组合的模式构建完成。在这篇文章中，我们将分享与客户合作以...

4个月前

01.4K0

多为来自Anthropic的专家关于Prompt Engineering的讨论

多为来自Anthropic的专家关于Prompt Engineering的讨论

AI总结概述 AI 提示工程的深入探讨，通过一个圆桌会议的形式，多位来自 Anthropic 的专家从研究、消费和企业等不同角度分享了他们对提示工程的理解和实践经验。文章详细阐述了提示工程的定义...

6个月前

09200

Scaling Test-Time Compute：向量模型上的思维链

Scaling Test-Time Compute：向量模型上的思维链

自从 OpenAI 发布了 o1 模型后，Scaling Test-Time Compute（扩展推理时计算）就成了 AI 圈子里最火爆的话题之一。简单来说，与其在预训练或后训练阶段疯狂堆算力，不如在...

6个月前

01.5K0

2024年度RAG清单，RAG应用策略100+

2024年度RAG清单，RAG应用策略100+

回顾2024，大模型日新月异，智能体百家争鸣。作为AI应用的重要组成部分，RAG也是“群雄逐鹿，诸侯并起”。年初ModularRAG持续升温、GraphRAG大放异彩，年中开源工具如火如荼、知识图...

6个月前

01.3K0

Best-of-N 越狱法：对输入内容进行简单的随机变形并反复尝试，就能让主流 AI 系统突破安全限制产生有害回应

Best-of-N 越狱法：对输入内容进行简单的随机变形并反复尝试，就能让主流 AI 系统突破安全限制产生有害回应

近年来，随着生成式 AI（Generative AI）和大语言模型（LLM）的迅速发展，其安全性和可靠性问题引起了广泛关注。一项最新研究发现了一种被称为 Best-of-N 越狱法（简称 BoN）的...

4个月前

01K0

卷起来了！长文本向量模型分块策略大比拼

卷起来了！长文本向量模型分块策略大比拼

长文本向量模型能够将十页长的文本编码为单个向量，听起来很强大，但真的实用吗？很多人觉得... 未必。直接用行不行？该不该分块？怎么分才最高效？本文将带你深入探讨长文本向量模型的不同分块策略，分析利...

6个月前

08940