LOADING

AI-Wissensdatenbank

Insgesamt 207 Artikel

Informationen zum Kurs AI-Utility-Befehle Neueste AI-Tools AI-Wissensdatenbank AI-Nachrichten Praktische AI-Tutorials AI-Antworten

in Ordnung bringen

Beitrag Update überfliegen Anerkennung

CAG：比RAG快40倍的缓存增强生成方法

CAG: Eine cache-gestützte Generierungsmethode, die 40 Mal schneller ist als RAG

比RAG(检索增强生成)快40倍的CAG(缓存增强生成)。CAG彻底改变了知识获取方式：不再是实时检索外部数据，而是预先将所有知识加载到模型上下文中。这就像是把一个巨大的图书馆浓缩成了一本随身携带的工...

AI-Wissensdatenbank

vor 5 Monaten

01.1K0

谷歌Agents与基础应用白皮书（中文版）

Weißbuch über Google-Agenten und Basisanwendungen (chinesische Version)

作者：Julia Wiesinger，Patrick Marlow和 Vladimir Vuskovic 原文：https://www.kaggle.com/whitepaper-agents 目...

AI-Wissensdatenbank

vor 5 Monaten

01.6K0

2023年老文回顾：RAG 系统构建流程与评估指南

2023 Überprüfung eines alten Artikels: Ein Leitfaden für den Aufbau des RAG-Systems und dessen Bewertung

检索增强生成（Retrieval Augmented Generation，RAG）正在成为大语言模型（LLM）和向量数据库最受欢迎的应用之一。RAG 是通过从向量数据库（例如 Weaviate）检索...

AI-Wissensdatenbank

vor 5 Monaten

08580

走近多智能体系统（MAS）：协同合作的 AI 世界

Annäherung an Multi-Agenten-Systeme (MAS): eine kollaborative KI-Welt

多智能体系统 (Multi-Agent System, MAS) 是一个由多个交互的智能体 (Intelligent Agent) 组成的计算系统。多智能体系统可用于解决单个智能体或单体系统难以解决或...

AI-Wissensdatenbank

vor 3 Monaten

04650

一文带你了解RAG(检索增强生成)，概念理论介绍+ 代码实操

Ein Artikel zum Verständnis von RAG (Retrieval Augmented Generation), dem Konzept der theoretischen Einführung + Code-Praxis

一、LLMs 已经具备了较强能力了，为什么还需要 RAG(检索增强生成)? 尽管 LLM 已展现出显著的能力，但以下几个挑战依然值得关注：幻觉问题：LLM 采用基于统计的概率方法逐词生成文本，这一机...

AI-Wissensdatenbank

vor 5 Monaten

09430

OpenAI-o3 与 Monte-Carlo 思想

OpenAI-o3 und Monte-Carlo-Ideen

o3 来了，分享一些个人的浅见。关于 Test-time Scaling Law 的进展，比我们想象中的要快得多。但我想说的是，这条路其实有些曲折——它是 OpenAI 在追求 AGI 的道路上，采取...

AI-Wissensdatenbank

vor 5 Monaten

08550

如何为RAG应用选择最佳Embedding模型

Wie man das beste Einbettungsmodell für RAG-Anwendungen auswählt

向量Embedding是目前检索增强生成（RAG）应用程序的核心。它们捕获数据对象（如文本，图像等）的语义信息，并以数字数组表示。在时下的生成式AI应用中，这些向量Embedding通常由Embedd...

AI-Wissensdatenbank

vor 5 Monaten

09920

万字长文讲透 RAG 在DB-GPT实际落地场景中的优化

Ein 10.000 Wörter umfassender Artikel über die RAG-Optimierung in realen DB-GPT-Szenarien.

前言在过去两年中，检索增强生成（RAG，Retrieval-Augmented Generation）技术逐渐成为提升智能体的核心组成部分。通过结合检索与生成的双重能力，RAG能够引入外部知识，从而...

AI-Wissensdatenbank

vor 5 Monaten

09060

2025年值得入坑的 AI Agent 五大框架

Die 5 besten KI-Agenten-Frameworks, die sich im Jahr 2025 lohnen

Agent 目前我见到的最多的翻译是“智能体”，但是直译是“代理”。那 Agentic 又要翻译成什么呢？我感觉“代理型”这样的词更合适。所以为了不让读者混淆，我在本文直接用英文表示。随着 ...

AI-Wissensdatenbank

vor 5 Monaten

02K0

朴素、有效的RAG检索策略：稀疏+密集混合检索并重排，并利用“提示缓存”为文本块生成整体文档相关的上下文

Einfache, effektive RAG-Retrieval-Strategie: sparse + dense Hybrid-Suche und -Umordnung sowie Verwendung von "cue caching" zur Generierung von dokumentenrelevantem Gesamtkontext für Textabschnitte.

为了让 AI 模型在特定场景中发挥作用，它通常需要访问背景知识。例如，客户支持聊天机器人需要了解其服务的具体业务，而法律分析机器人需要掌握大量的过往案例。开发者通常使用检索增强生成（Retrieva...

AI-Wissensdatenbank # Wissensabfrage und RAG-Rahmen

vor 5 Monaten

09840

小白也能看懂的大模型微调知识点

Große Wissenspunkte zur Feinabstimmung des Modells, die auch ein Anfänger verstehen kann

大模型微调全流程建议在微调过程中严格按照以上流程执行，避免跳步，否则可能导致无效劳动。比如，如果没有充分构建数据集，最终发现微调模型效果不佳是数据集质量的问题，那么前期的努力将付诸东流，事倍功半...

AI-Wissensdatenbank

vor 5 Monaten

09030

万字长文梳理基于LLM的Text-to-SQL发展进程

Ein Artikel mit 10.000 Wörtern, um den Entwicklungsprozess von LLM-basiertem Text-to-SQL zu sortieren

OlaChat AI数智助手万字长文深度解析，带你了解Text-to-SQL技术的前世今生。论文：Next-Generation Database Interfaces: A Survey of L...

AI-Wissensdatenbank

vor 5 Monaten

09000

Late Chunking×Milvus：如何提高RAG准确率

Late Chunking x Milvus: Wie man die RAG-Genauigkeit verbessert

01.背景在RAG应用开发中，第一步就是对于文档进行chunking（分块），高效的文档分块，可以有效的提高后续的召回内容的准确性。而对于如何高效的分块是个讨论的热点，有诸如固定大小分块，随机大小分...

AI-Wissensdatenbank

vor 5 Monaten

09950

Anthropic总结构建高效智能体简单且有效的方法

Anthropic fasst einfache und effektive Wege zum Aufbau effizienter Intelligenz zusammen

在过去的一年里，我们与多个行业中构建大语言模型 (LLM) 代理的团队合作。始终发现，最成功的实现并未使用复杂的框架或专用库，而是通过简单、可组合的模式构建完成。在这篇文章中，我们将分享与客户合作以...

AI-Wissensdatenbank

vor 3 Monaten

01.4K0

多为来自Anthropic的专家关于Prompt Engineering的讨论

Vor allem Experten von Anthropic diskutieren Prompt Engineering

AI总结概述 AI 提示工程的深入探讨，通过一个圆桌会议的形式，多位来自 Anthropic 的专家从研究、消费和企业等不同角度分享了他们对提示工程的理解和实践经验。文章详细阐述了提示工程的定义...

AI-Wissensdatenbank

vor 6 Monaten

09170

Scaling Test-Time Compute：向量模型上的思维链

Skalierung der Testzeitberechnung: Gedankenkette über Vektormodelle

自从 OpenAI 发布了 o1 模型后，Scaling Test-Time Compute（扩展推理时计算）就成了 AI 圈子里最火爆的话题之一。简单来说，与其在预训练或后训练阶段疯狂堆算力，不如在...

AI-Wissensdatenbank

vor 6 Monaten

01.5K0

2024年度RAG清单，RAG应用策略100+

2024 RAG-Bestandsaufnahme, RAG-Anwendungsstrategie 100+

回顾2024，大模型日新月异，智能体百家争鸣。作为AI应用的重要组成部分，RAG也是“群雄逐鹿，诸侯并起”。年初ModularRAG持续升温、GraphRAG大放异彩，年中开源工具如火如荼、知识图...

AI-Wissensdatenbank

vor 6 Monaten

01.3K0

Best-of-N 越狱法：对输入内容进行简单的随机变形并反复尝试，就能让主流 AI 系统突破安全限制产生有害回应

Best-of-N Jailbreak: ein einfaches zufälliges Morphen von Eingaben und wiederholte Versuche, Mainstream-KI-Systeme dazu zu bringen, Sicherheitsbeschränkungen zu durchbrechen und schädliche Reaktionen zu erzeugen

近年来，随着生成式 AI（Generative AI）和大语言模型（LLM）的迅速发展，其安全性和可靠性问题引起了广泛关注。一项最新研究发现了一种被称为 Best-of-N 越狱法（简称 BoN）的...

AI-Wissensdatenbank

vor 4 Monaten

01K0

卷起来了！长文本向量模型分块策略大比拼

Aufgerollt! Langtext-Vektor-Modelle Chunking-Strategien Wettbewerb

长文本向量模型能够将十页长的文本编码为单个向量，听起来很强大，但真的实用吗？很多人觉得... 未必。直接用行不行？该不该分块？怎么分才最高效？本文将带你深入探讨长文本向量模型的不同分块策略，分析利...

AI-Wissensdatenbank

vor 6 Monaten

08900