DeepSeek R1 越狱:尝试突破 DeepSeek 的审查机制DeepSeek R1 官网越狱是非常好的实验环境,能触发到基本所有类型的审查机制,可以学习很多防御技巧,所以这是一篇大模型审查机制的学习文章,会带你看到历年来大模型越狱的示例。 大模型审查机制通...Base de connaissances sur l'IAIl y a 4 mois03K0
Windsurf 与 GitHub Copilot:4 个关键差异及如何选择什么是 Windsurf? Windsurf 是一款由 AI 驱动的编码助手,提供一系列功能以简化开发者的编码流程。与 GitHub Copilot 类似,它利用机器学习模型来理解代码上下文并提供智能...Base de connaissances sur l'IAIl y a 6 mois02.4K0
高级 RAG:架构、技术、应用和发展前景检索增强生成(Retrieval-augmented generation,RAG)已经成为 AI 领域的重要框架,极大提升了大语言模型(LLMs)在使用外部知识源生成响应时的准确性和相关性。据 Da...Base de connaissances sur l'IAIl y a 9 mois02K0
2025年值得入坑的 AI Agent 五大框架Agent 目前我见到的最多的翻译是“智能体”,但是直译是“代理”。 那 Agentic 又要翻译成什么呢?我感觉“代理型”这样的词更合适。 所以为了不让读者混淆,我在本文直接用英文表示。 随着 ...Base de connaissances sur l'IAil y a 5 mois02K0
Anthropic开源的模型上下文协议:Model Context Protocol(MCP),让AI助手原生接入本地数据今天,我们开源了 Model Context Protocol (MCP),这是一种全新的标准,用于将 AI 助手与存储数据的系统连接起来,包括内容库、业务工具和开发环境。其目标是帮助前沿模型生成更好...Base de connaissances sur l'IAIl y a 6 mois01.7K0
谷歌Agents与基础应用白皮书(中文版)作者:Julia Wiesinger,Patrick Marlow和 Vladimir Vuskovic 原文:https://www.kaggle.com/whitepaper-agents 目...Base de connaissances sur l'IAil y a 5 mois01.5K0
Llama 3:一个多功能、开源的 AI 模型系列摘要: 本文介绍了一系列新的基础模型,称为 Llama 3。Llama 3 是一个语言模型群体,天生支持多语言、代码编写、推理和工具使用。我们最大的模型是一个具有 4050 亿个参数和高达 128,0...Base de connaissances sur l'IAIl y a 9 mois01.5K0
ReAct: 大语言模型中推理和行动协同工作原文:https://arxiv.org/pdf/2210.03629.pdf 看完也无法理解ReAct如何运作和应用?请看《ReAct实现逻辑实操》,用实际案例进行讲解。 摘要 虽然大型语言...Base de connaissances sur l'IAIl y a 10 mois01.5K0
Scaling Test-Time Compute:向量模型上的思维链自从 OpenAI 发布了 o1 模型后,Scaling Test-Time Compute(扩展推理时计算)就成了 AI 圈子里最火爆的话题之一。简单来说,与其在预训练或后训练阶段疯狂堆算力,不如在...Base de connaissances sur l'IAIl y a 6 mois01.5K0
RAG:检索增强RAG(Retrieve Augmented Generation,检索增强生成)是一种以权威知识库资讯为基础来优化大型语言模型(LLMs)输出的技术。这项技术通过扩展LLMs的功能,使其在生成回答时...Base de connaissances sur l'IAil y a 1 an01.4K0
大模型结构化数据输出方法:精选 LLM JSON 资源列表此精选列表专注于使用大语言模型(LLM)生成 JSON 或其他结构化输出的相关资源。 通过函数调用、工具、CFG 等方式使用 LLM 生成 JSON 的资源列表,涵盖库、模型、Notebooks 等...Base de connaissances sur l'IAil y a 5 mois01.4K0
Tokenization(分词标记化)各位好,今天我们要探讨大型语言模型(LLM)中的分词技术。遗憾的是,分词在当前顶尖的LLM中是一个比较复杂且棘手的部分,但理解它的某些细节非常必要,因为很多人将LLM的一些缺点归咎于神经网络或其他显得...Base de connaissances sur l'IAIl y a 4 mois01.4K0
全球领先组织的185个真实生成式AI用例(Google的AI解决方案)展示顶级公司、政府、研究人员和初创企业如何利用Google的AI解决方案来增强他们的工作。 这篇文章最初发布于 Transform with Google Cloud 博客. 首次发布于2024年4月...Base de connaissances sur l'IAIl y a 8 mois01.4K0
Anthropic总结构建高效智能体简单且有效的方法在过去的一年里,我们与多个行业中构建大语言模型 (LLM) 代理的团队合作。始终发现,最成功的实现并未使用复杂的框架或专用库,而是通过简单、可组合的模式构建完成。 在这篇文章中,我们将分享与客户合作以...Base de connaissances sur l'IAIl y a 3 mois01.4K0
CoT(Chain-of-Thought) 链式思维又称:思维链 Chain-of-Thought的定义和原理 "Chain-of-Thought"(简称CoT)是一种思维方法,其原理是建立一个由一系列关联的思考步骤组成的思考链。该方法通过将思考过程分...Base de connaissances sur l'IAIl y a 10 mois01.3K0
回顾Transformer,并深入讲解替代方案Mamba原理(图解)一种语言建模中 Transformer 的替代方案 Transformer 架构是大语言模型(LLMs)成功的关键组成部分。几乎所有今天使用的大语言模型都采用了该架构,从开源模型如 Mistral 到...Base de connaissances sur l'IAIl y a 7 mois01.3K0
2024年度RAG清单,RAG应用策略100+ 回顾2024,大模型日新月异,智能体百家争鸣。作为AI应用的重要组成部分,RAG也是“群雄逐鹿,诸侯并起”。年初ModularRAG持续升温、GraphRAG大放异彩,年中开源工具如火如荼、知识图...Base de connaissances sur l'IAil y a 5 mois01.3K0
AlphaCodium:引领代码生成新境界,从提示工程到流程工程原文:[State-of-the-art Code Generation with AlphaCodium – From Prompt Engineering to Flow Engineering...Base de connaissances sur l'IAil y a 1 an01.3K0
检索增强生成(RAG)原理与实践基础构建指南(译) 尽管越来越大的、更智能的模型不断发布,最先进的生成式大语言模型(LLM)仍然存在一个重大问题:它们在处理需要专业知识的任务时表现不佳。这种缺乏专业知识可能导致一些问题,例如幻觉现象,即模型生成不准...Base de connaissances sur l'IAIl y a 7 mois01.3K0