CAG: Eine cache-gestützte Generierungsmethode, die 40 Mal schneller ist als RAG比RAG(检索增强生成)快40倍的CAG(缓存增强生成)。CAG彻底改变了知识获取方式:不再是实时检索外部数据,而是预先将所有知识加载到模型上下文中。这就像是把一个巨大的图书馆浓缩成了一本随身携带的工...AI-Wissensdatenbankvor 5 Monaten01.1K0
Weißbuch über Google-Agenten und Basisanwendungen (chinesische Version)作者:Julia Wiesinger,Patrick Marlow和 Vladimir Vuskovic 原文:https://www.kaggle.com/whitepaper-agents 目...AI-Wissensdatenbankvor 5 Monaten01.6K0
2023 Überprüfung eines alten Artikels: Ein Leitfaden für den Aufbau des RAG-Systems und dessen Bewertung检索增强生成(Retrieval Augmented Generation,RAG)正在成为大语言模型(LLM)和向量数据库最受欢迎的应用之一。RAG 是通过从向量数据库(例如 Weaviate)检索...AI-Wissensdatenbankvor 5 Monaten08580
Annäherung an Multi-Agenten-Systeme (MAS): eine kollaborative KI-Welt多智能体系统 (Multi-Agent System, MAS) 是一个由多个交互的智能体 (Intelligent Agent) 组成的计算系统。多智能体系统可用于解决单个智能体或单体系统难以解决或...AI-Wissensdatenbankvor 3 Monaten04650
Ein Artikel zum Verständnis von RAG (Retrieval Augmented Generation), dem Konzept der theoretischen Einführung + Code-Praxis一、LLMs 已经具备了较强能力了,为什么还需要 RAG(检索增强生成)? 尽管 LLM 已展现出显著的能力,但以下几个挑战依然值得关注: 幻觉问题:LLM 采用基于统计的概率方法逐词生成文本,这一机...AI-Wissensdatenbankvor 5 Monaten09430
OpenAI-o3 und Monte-Carlo-Ideeno3 来了,分享一些个人的浅见。关于 Test-time Scaling Law 的进展,比我们想象中的要快得多。但我想说的是,这条路其实有些曲折——它是 OpenAI 在追求 AGI 的道路上,采取...AI-Wissensdatenbankvor 5 Monaten08550
Wie man das beste Einbettungsmodell für RAG-Anwendungen auswählt向量Embedding是目前检索增强生成(RAG)应用程序的核心。它们捕获数据对象(如文本,图像等)的语义信息,并以数字数组表示。在时下的生成式AI应用中,这些向量Embedding通常由Embedd...AI-Wissensdatenbankvor 5 Monaten09920
Ein 10.000 Wörter umfassender Artikel über die RAG-Optimierung in realen DB-GPT-Szenarien.前言 在过去两年中,检索增强生成(RAG,Retrieval-Augmented Generation)技术逐渐成为提升智能体的核心组成部分。通过结合检索与生成的双重能力,RAG能够引入外部知识,从而...AI-Wissensdatenbankvor 5 Monaten09060
Die 5 besten KI-Agenten-Frameworks, die sich im Jahr 2025 lohnenAgent 目前我见到的最多的翻译是“智能体”,但是直译是“代理”。 那 Agentic 又要翻译成什么呢?我感觉“代理型”这样的词更合适。 所以为了不让读者混淆,我在本文直接用英文表示。 随着 ...AI-Wissensdatenbankvor 5 Monaten02K0
Einfache, effektive RAG-Retrieval-Strategie: sparse + dense Hybrid-Suche und -Umordnung sowie Verwendung von "cue caching" zur Generierung von dokumentenrelevantem Gesamtkontext für Textabschnitte.为了让 AI 模型在特定场景中发挥作用,它通常需要访问背景知识。例如,客户支持聊天机器人需要了解其服务的具体业务,而法律分析机器人需要掌握大量的过往案例。 开发者通常使用检索增强生成(Retrieva...AI-Wissensdatenbank# Wissensabfrage und RAG-Rahmenvor 5 Monaten09840
Große Wissenspunkte zur Feinabstimmung des Modells, die auch ein Anfänger verstehen kann大模型微调全流程 建议在微调过程中严格按照以上流程执行,避免跳步,否则可能导致无效劳动。比如,如果没有充分构建数据集,最终发现微调模型效果不佳是数据集质量的问题,那么前期的努力将付诸东流,事倍功半...AI-Wissensdatenbankvor 5 Monaten09030
Ein Artikel mit 10.000 Wörtern, um den Entwicklungsprozess von LLM-basiertem Text-to-SQL zu sortierenOlaChat AI数智助手万字长文深度解析,带你了解Text-to-SQL技术的前世今生。 论文:Next-Generation Database Interfaces: A Survey of L...AI-Wissensdatenbankvor 5 Monaten09000
Late Chunking x Milvus: Wie man die RAG-Genauigkeit verbessert01.背景 在RAG应用开发中,第一步就是对于文档进行chunking(分块),高效的文档分块,可以有效的提高后续的召回内容的准确性。而对于如何高效的分块是个讨论的热点,有诸如固定大小分块,随机大小分...AI-Wissensdatenbankvor 5 Monaten09950
Anthropic fasst einfache und effektive Wege zum Aufbau effizienter Intelligenz zusammen在过去的一年里,我们与多个行业中构建大语言模型 (LLM) 代理的团队合作。始终发现,最成功的实现并未使用复杂的框架或专用库,而是通过简单、可组合的模式构建完成。 在这篇文章中,我们将分享与客户合作以...AI-Wissensdatenbankvor 3 Monaten01.4K0
Vor allem Experten von Anthropic diskutieren Prompt EngineeringAI总结 概述 AI 提示工程 的深入探讨,通过一个圆桌会议的形式,多位来自 Anthropic 的专家从研究、消费和企业等不同角度分享了他们对提示工程的理解和实践经验。 文章详细阐述了提示工程的定义...AI-Wissensdatenbankvor 6 Monaten09170
Skalierung der Testzeitberechnung: Gedankenkette über Vektormodelle自从 OpenAI 发布了 o1 模型后,Scaling Test-Time Compute(扩展推理时计算)就成了 AI 圈子里最火爆的话题之一。简单来说,与其在预训练或后训练阶段疯狂堆算力,不如在...AI-Wissensdatenbankvor 6 Monaten01.5K0
2024 RAG-Bestandsaufnahme, RAG-Anwendungsstrategie 100+ 回顾2024,大模型日新月异,智能体百家争鸣。作为AI应用的重要组成部分,RAG也是“群雄逐鹿,诸侯并起”。年初ModularRAG持续升温、GraphRAG大放异彩,年中开源工具如火如荼、知识图...AI-Wissensdatenbankvor 6 Monaten01.3K0
Best-of-N Jailbreak: ein einfaches zufälliges Morphen von Eingaben und wiederholte Versuche, Mainstream-KI-Systeme dazu zu bringen, Sicherheitsbeschränkungen zu durchbrechen und schädliche Reaktionen zu erzeugen近年来,随着生成式 AI(Generative AI)和大语言模型(LLM)的迅速发展,其安全性和可靠性问题引起了广泛关注。一项最新研究发现了一种被称为 Best-of-N 越狱法 (简称 BoN)的...AI-Wissensdatenbankvor 4 Monaten01K0
Aufgerollt! Langtext-Vektor-Modelle Chunking-Strategien Wettbewerb长文本向量模型能够将十页长的文本编码为单个向量,听起来很强大,但真的实用吗? 很多人觉得... 未必。 直接用行不行?该不该分块?怎么分才最高效?本文将带你深入探讨长文本向量模型的不同分块策略,分析利...AI-Wissensdatenbankvor 6 Monaten08900