DeepSeek R1 Jailbreak: Trying to Break DeepSeek's CensorshipDeepSeek R1 官网越狱是非常好的实验环境,能触发到基本所有类型的审查机制,可以学习很多防御技巧,所以这是一篇大模型审查机制的学习文章,会带你看到历年来大模型越狱的示例。 大模型审查机制通...AI Knowledge Base4mos ago03K0
Windsurf vs. GitHub Copilot: 4 Key Differences and How to Choose什么是 Windsurf? Windsurf 是一款由 AI 驱动的编码助手,提供一系列功能以简化开发者的编码流程。与 GitHub Copilot 类似,它利用机器学习模型来理解代码上下文并提供智能...AI Knowledge Base6mos ago02.4K0
Top 5 AI Agent Frameworks Worth Getting Into in 2025Agent 目前我见到的最多的翻译是“智能体”,但是直译是“代理”。 那 Agentic 又要翻译成什么呢?我感觉“代理型”这样的词更合适。 所以为了不让读者混淆,我在本文直接用英文表示。 随着 ...AI Knowledge Base5mos ago02K0
Advanced RAG: Architecture, Technology, Applications and Development Perspectives检索增强生成(Retrieval-augmented generation,RAG)已经成为 AI 领域的重要框架,极大提升了大语言模型(LLMs)在使用外部知识源生成响应时的准确性和相关性。据 Da...AI Knowledge Base9mos ago02K0
Anthropic's open-source Model Context Protocol: Model Context Protocol (MCP) to give AI assistants native access to local data今天,我们开源了 Model Context Protocol (MCP),这是一种全新的标准,用于将 AI 助手与存储数据的系统连接起来,包括内容库、业务工具和开发环境。其目标是帮助前沿模型生成更好...AI Knowledge Base6mos ago01.7K0
Google Agents and Basic Applications White Paper (Chinese version)作者:Julia Wiesinger,Patrick Marlow和 Vladimir Vuskovic 原文:https://www.kaggle.com/whitepaper-agents 目...AI Knowledge Base5mos ago01.5K0
Llama 3: A Versatile, Open Source Family of AI Models摘要: 本文介绍了一系列新的基础模型,称为 Llama 3。Llama 3 是一个语言模型群体,天生支持多语言、代码编写、推理和工具使用。我们最大的模型是一个具有 4050 亿个参数和高达 128,0...AI Knowledge Base9mos ago01.5K0
Scaling Test-Time Compute: Chain of Thought on Vector Models自从 OpenAI 发布了 o1 模型后,Scaling Test-Time Compute(扩展推理时计算)就成了 AI 圈子里最火爆的话题之一。简单来说,与其在预训练或后训练阶段疯狂堆算力,不如在...AI Knowledge Base5mos ago01.4K0
ReAct: Reasoning and Action Working Together in Large Language Models原文:https://arxiv.org/pdf/2210.03629.pdf 看完也无法理解ReAct如何运作和应用?请看《ReAct实现逻辑实操》,用实际案例进行讲解。 摘要 虽然大型语言...AI Knowledge Base10mos ago01.4K0
Structured Data Output Methods for Large Models: A Selected List of LLM JSON Resources此精选列表专注于使用大语言模型(LLM)生成 JSON 或其他结构化输出的相关资源。 通过函数调用、工具、CFG 等方式使用 LLM 生成 JSON 的资源列表,涵盖库、模型、Notebooks 等...AI Knowledge Base5mos ago01.4K0
Tokenization各位好,今天我们要探讨大型语言模型(LLM)中的分词技术。遗憾的是,分词在当前顶尖的LLM中是一个比较复杂且棘手的部分,但理解它的某些细节非常必要,因为很多人将LLM的一些缺点归咎于神经网络或其他显得...AI Knowledge Base4mos ago01.4K0
185 Real-World Generative AI Use Cases from Leading Global Organizations (Google's AI Solutions)展示顶级公司、政府、研究人员和初创企业如何利用Google的AI解决方案来增强他们的工作。 这篇文章最初发布于 Transform with Google Cloud 博客. 首次发布于2024年4月...AI Knowledge Base8mos ago01.4K0
RAG: Retrieval AugmentationRAG(Retrieve Augmented Generation,检索增强生成)是一种以权威知识库资讯为基础来优化大型语言模型(LLMs)输出的技术。这项技术通过扩展LLMs的功能,使其在生成回答时...AI Knowledge Base1yrs ago01.4K0
Anthropic summarizes simple and effective ways to build efficient intelligences在过去的一年里,我们与多个行业中构建大语言模型 (LLM) 代理的团队合作。始终发现,最成功的实现并未使用复杂的框架或专用库,而是通过简单、可组合的模式构建完成。 在这篇文章中,我们将分享与客户合作以...AI Knowledge Base3mos ago01.4K0
CoT (Chain-of-Thought) Chain of Thought又称:思维链 Chain-of-Thought的定义和原理 "Chain-of-Thought"(简称CoT)是一种思维方法,其原理是建立一个由一系列关联的思考步骤组成的思考链。该方法通过将思考过程分...AI Knowledge Base10mos ago01.3K0
Review of Transformer with an in-depth explanation of the principles of the alternative, Mamba (illustrated)一种语言建模中 Transformer 的替代方案 Transformer 架构是大语言模型(LLMs)成功的关键组成部分。几乎所有今天使用的大语言模型都采用了该架构,从开源模型如 Mistral 到...AI Knowledge Base7mos ago01.3K0
2024 RAG Inventory, RAG Application Strategy 100+ 回顾2024,大模型日新月异,智能体百家争鸣。作为AI应用的重要组成部分,RAG也是“群雄逐鹿,诸侯并起”。年初ModularRAG持续升温、GraphRAG大放异彩,年中开源工具如火如荼、知识图...AI Knowledge Base5mos ago01.3K0
AlphaCodium: Leading the Way to a New Realm of Code Generation, from Hint Engineering to Process Engineering原文:[State-of-the-art Code Generation with AlphaCodium – From Prompt Engineering to Flow Engineering...AI Knowledge Base1yrs ago01.3K0
Retrieval Augmented Generation (RAG) Principles and Practices Foundation Building Guide (Translation) 尽管越来越大的、更智能的模型不断发布,最先进的生成式大语言模型(LLM)仍然存在一个重大问题:它们在处理需要专业知识的任务时表现不佳。这种缺乏专业知识可能导致一些问题,例如幻觉现象,即模型生成不准...AI Knowledge Base7mos ago01.3K0