Chinchilla 时刻与 o3 时代:大语言模型“规模定律”的演进之路文章速读 文章全面而深入地探讨了 大语言模型 (LLM) 规模定律(缩放法则/Scaling Law)的前世今生,以及 AI 研究的未来方向。作者 Cameron R. Wolfe 以清晰的逻辑和丰富...Base de connaissances sur l'IAIl y a 4 mois08810
智能代理检索增强生成:Agentic RAG 技术综述摘要 大型语言模型(LLMs),如OpenAI的GPT-4、Google的PaLM和Meta的LLaMA,通过实现类人文本生成和自然语言理解,极大地改变了人工智能(AI)。然而,它们对静态训练数据的依...Base de connaissances sur l'IAIl y a 4 mois08890
LangGraph:基于有向无环图拓扑的AI Agent构建与执行框架人工智能(AI)是一个迅速发展的领域。语言模型已经发展到能够让AI Agent执行复杂任务和做出复杂决策。然而,随着这些Agent的技能不断提升,支持它们的基础设施难以跟上。 LangGraph,这是...Base de connaissances sur l'IAIl y a 4 mois01.2K0
揭示 AI 过滤器中的安全漏洞:使用字符代码绕过限制的深入研究介绍 和许多其他人一样,在过去几天里,我的新闻推送充斥着关于中国制造的 DeepSeek-R1 大语言模型的新闻、赞扬、抱怨和猜测,该模型于上周发布。该模型本身正被拿来与 OpenAI、Meta 等公...Base de connaissances sur l'IA# prompt jailbreakIl y a 4 mois08620
CoRAG:利用MCTS(蒙特卡洛树)动态链式 RAG 模型 CORAG 的主要贡献总结 CORAG(Cost-Constrained Retrieval Optimization for Retrieval-Augmented Generation)是一种...Base de connaissances sur l'IAIl y a 4 mois09160
Un article clair Distillation des connaissances (Distillation) : le "petit modèle" peut aussi avoir une "grande sagesse".知识蒸馏是一种机器学习技术,目的是将预先训练好的大型模型(即 "教师模型")的学习成果转移到较小的 "学生模型 "中。蒸馏技术可以帮助我们开发更轻量化的生成模型,用于智能对话、内容创作等领域。 最近 ...Base de connaissances sur l'IAIl y a 4 mois01.1K0
大模型参数量如何计算?7B、13B、65B 究竟代表什么?最近,许多从事大模型训练和推理的朋友都在讨论模型参数量和模型大小之间的关系。例如,著名的羊驼系列 LLaMA 大模型,就包含了 LLaMA-7B、LLaMA-13B、LLaMA-33B 和 LLaMA...Base de connaissances sur l'IAIl y a 4 mois01.3K0
CLOB:仅使用提示词让大语言模型持续学习一系列任务原文:https://arxiv.org/pdf/2412.15479 解读:此文章本身创新不多,应用意义也不大。不过,让我想起很久很久以前阅读的三篇高含金量的文章,阅读此文结合之前的三篇文章,希望给...Base de connaissances sur l'IAIl y a 4 mois07420
向量数据库深度对比:Weaviate、Milvus 与 Qdrant在人工智能和机器学习领域,尤其是在构建如 RAG(检索增强生成)系统和语义搜索等应用时,高效地处理和检索海量非结构化数据变得至关重要。向量数据库应运而生,成为解决这一挑战的核心技术。它们不仅是存储高维...Base de connaissances sur l'IAIl y a 4 mois01.2K0
解锁小红书营销密码:海外用户运营增长指南 (附PDF下载)小红书,这个在中国乃至亚洲地区炙手可热的社交电商平台,早已超越了简单的购物App,成为了年轻人生活方式的风向标和品牌营销的新阵地。对于希望进军中国市场或触达年轻消费群体的海外品牌和个人来说,掌握小红书...Base de connaissances sur l'IA# AI Side Hustle Money Making Project (Projet de création d'argent)Il y a 4 mois09130
从 Cline 开始了解 AI Coding 工作原理没想到,AI 在编程领域掀起了半变天。从 v0 、bolt.new 再到各类结合 Agant 的编程工具 Cursor、Windsurf,AI Coding 已经具备 idea MVP 的巨大潜力。从...Base de connaissances sur l'IAIl y a 4 mois01.2K0
工作流(Workflow):一文读懂工作流的运行原理开始之前,先了解几个“关键词”: 工作流 (Workflow): 简单说,就是 “完成一件事的完整步骤”。 它像一份“说明书”,告诉你为了达成目标,需要做什么、按什么顺序做、谁来做。 输入 (Inpu...Base de connaissances sur l'IAIl y a 4 mois01K0
ZEP : une architecture de graphe de connaissances temporelles pour la mémoire corporelle intelligenteRésumé Nous présentons Zep, un nouveau service de couche mémoire pour l'intelligentsia qui surpasse le système de pointe actuel MemGPT dans les benchmarks de Deep Memory Retrieval (DMR).Base de connaissances sur l'IAIl y a 1 mois02190
一小时内将 Cursor 变成 Devin,并了解两者的差异本文是“理解和部署智能体 AI”系列的一部分: 智能体 AI 系列 1:Devin 和 Agent Cursor 之间的比较 智能体 AI 系列 2:从思考者到执行者 —— 智能体 AI 的范式革命和...Base de connaissances sur l'IAil y a 5 mois09990
实现 LLM 记忆系统的五种方式在构建大语言模型(LLM)应用时,记忆系统是提升对话上下文管理、长期信息存储以及语义理解能力的关键技术之一。一个高效的记忆系统可以帮助模型在长时间对话中保持一致性,提取关键信息,甚至具备检索历史对话的...Base de connaissances sur l'IAil y a 5 mois09630
OpenAI 函数调用(Function calling)OpenAI Function calling V2 特点 Function calling V2 的核心目标是赋予 OpenAI 模型与外部世界交互的能力,主要体现在以下两个核心功能: 数据获取 ...Base de connaissances sur l'IAIl y a 4 mois07640
Retrieval:什么是Retrieval?解释RAG中常见的"检索"技术基本概念 在信息技术领域,检索 (Retrieval) 指的是从一个大型数据集(通常是文档、网页、图像、音频、视频或其他形式的信息)中,根据用户的查询或需求,高效地定位和提取相关信息的过程。 其核心目...Base de connaissances sur l'IAil y a 5 mois09350
Agent AI: 探索多模态交互的前沿世界[李飞飞-经典必读]《Agent AI: Surveying the Horizons of Multimodal Interaction》 原文:https://ar5iv.labs.arxiv.org/html/24...Base de connaissances sur l'IAil y a 5 mois01.2K0
GraphReader:基于图的智能体,增强大型语言模型的长文本处理能力GraphReader:基于图的智能体,增强大型语言模型的长文本处理能力 图解专家:像个善于制作思维导图的导师,将冗长的文本转化为清晰的知识网络,让AI能够像沿着地图探索一样,轻松找到答案需要的各个关...Base de connaissances sur l'IAil y a 5 mois08330