How to choose the best Embedding model for a RAG application向量Embedding是目前检索增强生成(RAG)应用程序的核心。它们捕获数据对象(如文本,图像等)的语义信息,并以数字数组表示。在时下的生成式AI应用中,这些向量Embedding通常由Embedd...AI Knowledge Base5mos ago09960
How to choose the right Embedding model?检索增强生成(RAG)是生成式 AI (GenAI)中的一类应用,支持使用自己的数据来增强 LLM 模型(如 ChatGPT)的知识。 RAG 通常会用到三种不同的AI模型,即 Embedding 模...AI Knowledge Base5mos ago07870
A 10,000-word article on RAG optimization in DB-GPT real-world scenarios.前言 在过去两年中,检索增强生成(RAG,Retrieval-Augmented Generation)技术逐渐成为提升智能体的核心组成部分。通过结合检索与生成的双重能力,RAG能够引入外部知识,从而...AI Knowledge Base5mos ago09160
Top 5 AI Agent Frameworks Worth Getting Into in 2025Agent 目前我见到的最多的翻译是“智能体”,但是直译是“代理”。 那 Agentic 又要翻译成什么呢?我感觉“代理型”这样的词更合适。 所以为了不让读者混淆,我在本文直接用英文表示。 随着 ...AI Knowledge Base5mos ago02.1K0
Large model fine-tuning knowledge points that even a novice can understand大模型微调全流程 建议在微调过程中严格按照以上流程执行,避免跳步,否则可能导致无效劳动。比如,如果没有充分构建数据集,最终发现微调模型效果不佳是数据集质量的问题,那么前期的努力将付诸东流,事倍功半...AI Knowledge Base5mos ago09130
A 10,000-word article comprehending the development process of LLM-based Text-to-SQLOlaChat AI数智助手万字长文深度解析,带你了解Text-to-SQL技术的前世今生。 论文:Next-Generation Database Interfaces: A Survey of L...AI Knowledge Base6mos ago09100
Late Chunking x Milvus: How to Improve RAG Accuracy01.背景 在RAG应用开发中,第一步就是对于文档进行chunking(分块),高效的文档分块,可以有效的提高后续的召回内容的准确性。而对于如何高效的分块是个讨论的热点,有诸如固定大小分块,随机大小分...AI Knowledge Base6mos ago09980
2024 RAG Inventory, RAG Application Strategy 100+ 回顾2024,大模型日新月异,智能体百家争鸣。作为AI应用的重要组成部分,RAG也是“群雄逐鹿,诸侯并起”。年初ModularRAG持续升温、GraphRAG大放异彩,年中开源工具如火如荼、知识图...AI Knowledge Base6mos ago01.3K0
Structured Data Output Methods for Large Models: A Selected List of LLM JSON Resources此精选列表专注于使用大语言模型(LLM)生成 JSON 或其他结构化输出的相关资源。 通过函数调用、工具、CFG 等方式使用 LLM 生成 JSON 的资源列表,涵盖库、模型、Notebooks 等...AI Knowledge Base6mos ago01.5K0
AI education track 10,000 words analysis: what are the representative products? What are the opportunities? What are the future possibilities?教育一直被认为是会被LLM改变最大的行业之一。ChatGPT 的使用场景中,教育占据了很大比重,其用量常随开学和假期规律波动。而 Andrej Karpathy 也选择了教育作为他的创业方向。人们都期...AI Knowledge Base6mos ago01K0
Mostly experts from Anthropic discuss Prompt EngineeringAI总结 概述 AI 提示工程 的深入探讨,通过一个圆桌会议的形式,多位来自 Anthropic 的专家从研究、消费和企业等不同角度分享了他们对提示工程的理解和实践经验。 文章详细阐述了提示工程的定义...AI Knowledge Base6mos ago09220
Scaling Test-Time Compute: Chain of Thought on Vector Models自从 OpenAI 发布了 o1 模型后,Scaling Test-Time Compute(扩展推理时计算)就成了 AI 圈子里最火爆的话题之一。简单来说,与其在预训练或后训练阶段疯狂堆算力,不如在...AI Knowledge Base6mos ago01.5K0
Rolled Up! Long Text Vector Model Chunking Strategies Competition长文本向量模型能够将十页长的文本编码为单个向量,听起来很强大,但真的实用吗? 很多人觉得... 未必。 直接用行不行?该不该分块?怎么分才最高效?本文将带你深入探讨长文本向量模型的不同分块策略,分析利...AI Knowledge Base6mos ago08990
How to Test LLM Cues Effectively - A Complete Guide from Theory to Practice 一、测试提示词的根本原因: LLM 对提示词高度敏感,细微的措辞变化可能导致显著不同的输出结果 未经测试的提示词可能产生: 事实错误的信息 不相关的回复 不必要的 API 成本浪费 二、系统化的提...AI Knowledge Base6mos ago08350
AI Engineering Academy: 4 Guide to Engineering Intelligent Bodies欢迎来到 AI 工程学院的 AI 代理部分!本模块探索 AI 代理的迷人世界,从基本模式到实际应用。学习如何创建、协调和部署智能代理,这些代理能够执行复杂任务并对其环境进行推理。 📚 仓库结构 类...AI Knowledge Base6mos ago08750
AI Engineering Institute: 3Fine-tuning (fine-tuning of large language models)📚 资料库结构 模型/目录 描述与内容 Axolotl 用于微调语言模型的框架 Gemma Google 最新的大语言模型实现 - finetune-gemma.ipynb - gemma-sft.p...AI Knowledge Base6mos ago09120
AI工程学院:2.18Vision RAG 视觉能力笔记:https://colab.research.google.com/github/run-llama/llama_index/blob/main/docs/docs/examples/multi...AI Knowledge Base6mos ago08650
AI Engineering Institute: 2.17 Multi-Document Agentic RAG (Multi-Document Intelligent Retrieval Enhanced Generation) 引言 基于智能体方法提升检索增强生成能力。多文档智能检索增强生成(Multi-Document Agentic RAG, Retrieval Augmented Generation)是一种先进的...AI Knowledge Base6mos ago09180
AI Engineering Academy: 2.16 GraphRAG (Graph Structure Based Retrieval Augmentation Generation Method) 引言 GraphRAG(基于图结构的检索增强生成)是一种先进的检索与生成方法。它结合了图数据结构的优势和大语言模型(LLM)的能力,克服了传统 RAG 系统的一些限制。 https://githu...AI Knowledge Base# Knowledge Graph6mos ago09060