DeepSeek R1 在 RAG 中的应用:实践经验总结DeepSeek R1 在首次发布时就展现出了强大的推理能力。在这篇博客文章中,我们详细分享了使用 DeepSeek R1 构建检索增强生成(Retrieval-Augmented Generatio...AI 기술 자료3 개월 전05730
一张图解释清楚构建RAG系统全貌这张图清晰地描绘了一个现代化的、复杂的问题解答(Question Answering, QA)或检索增强生成(Retrieval-Augmented Generation, RAG)系统的架构蓝图。它...AI 기술 자료3 개월 전05720
AI Coding 编辑器:揭秘 Cline 的工作原理近年来,人工智能(AI)技术在编程领域引发了一场深刻的变革。从 v0、bolt.new,到集成 Agent 技术的编程工具如 Cursor 和 Windsurf,AI Coding 展现出了在软件开发...AI 기술 자료3 개월 전05620
法律翻译领域:ChatGPT 与神经网络翻译 (NMT) 系统性能深度评测在日新月异的翻译技术浪潮中,ChatGPT (Chat Generative Pre-trained Transformer) 的横空出世无疑吸引了全球目光。作为一种先进的 大语言模型 (Large ...AI 기술 자료3 개월 전05560
MCP Server、Function Call 与 Agent 的协同与差异在人工智能 (AI) 领域,特别是大型语言模型 (LLM) 蓬勃发展的今天,理解 MCP Server、Function Call 和 Agent 这三个关键概念至关重要。它们如同 AI 系统的基石...AI 기술 자료3 개월 전05550
SPO:自监督提示词优化摘要 精心设计的提示对于提升大语言模型(LLMs)的推理能力,同时使其输出与不同领域的任务要求保持一致至关重要。然而,手动设计提示需要专业知识和反复试验。现有的提示优化方法旨在自动化这一过程,但它们严...AI 기술 자료3 개월 전05540
让 AI 停下来思考:Anthropic "Think" 工具如何增强 Claude 推理能力近期,Anthropic 公司推出了一种名为 "think" 的新工具,旨在增强 Claude 模型在复杂问题解决方面的能力。本文将深入探讨 "think" 工具的设计理念、性能表现以及实际应用中的最...AI 기술 자료3 개월 전05480
RIG(检索交错生成):边查边写的检索策略,适合查询实时数据技术核心:Retrieval Interleaved Generation (RIG) 什么是 RIG? RIG 是一种创新的生成方法,旨在解决大语言模型在处理统计数据时的“幻觉”(hallucina...AI 기술 자료4개월 전05400
Gemma 3 技术报告中文版Gemma 3 关键信息总结 一、关键指标 参数 详情 模型规模 1 亿到 270 亿参数,共四个版本:1B、4B、12B、27B 架构 基于 Transformer 的解码器专用架构,继承自 Gem...AI 기술 자료3 개월 전05390
大语言模型推理:在“思考不足”与“过度思考”之间寻求平衡大语言模型(LLM)的发展日新月异,其推理能力已成为衡量其智能水平的关键指标。特别是具备长推理能力的模型,例如 OpenAI 的 o1、DeepSeek-R1、QwQ-32B 和 Kimi K1.5 ...AI 기술 자료2개월 전05360
突破工具调用瓶颈:CoTools 框架助力大型语言模型高效利用海量工具引言 近年来,大型语言模型(LLMs)在人工智能领域取得了令人瞩目的进展,其强大的语言理解和生成能力使其在多个领域得到了广泛应用。然而,LLMs 在处理需要调用外部工具的复杂任务时,仍然面临诸多挑战...AI 기술 자료2개월 전05290
LangChain官方发布:探索提示词优化技巧作者:Krish Maniar 和 William Fu-Hinthorn 在编写提示词时,我们试图向大语言模型(LLM)传达我们的意图,以便它们能在复杂数据上应用这些指令。然而,一次性清晰表达所有细...AI 기술 자료3 개월 전05290
模块化 RAG 系统中使用推理模型的应用评估本文将介绍 Kapa.ai 近期在检索增强生成(Retrieval-Augmented Generation,简称 RAG)系统中,对 OpenAI 的 o3-mini 等推理模型进行探索的总结汇报...AI 기술 자료3 개월 전05190
[转载]QwQ-32B 的工具调用能力及 Agentic RAG 应用背景 近期,一篇名为 Search-R1: Training LLMs to Reason and Leverage Search Engines with Reinforcement Learnin...AI 기술 자료3 개월 전05070
Anthropic 深度剖析 Claude:揭示大型语言模型的的决策与推理过程像 Claude 这样的大型语言模型 (LLM) 并非由人类直接编写程序代码造就,它们是在海量数据中训练出来的。在这个过程中,模型自己学会了解决问题的策略。这些策略隐藏在模型生成每个词时进行的数十亿次...AI 기술 자료2개월 전05040
Embedding 微调:原理、流程与在法律领域中的实际应用本文旨在从多个角度详细讲解 Embedding 微调的基本概念、整体流程和关键技术,并探讨其在法律领域中的实际作用。通过本文,读者将了解如何利用法律领域的专业数据对预训练的 Embedding 模型进...AI 기술 자료3 개월 전05030
DeepRetrieval:强化学习驱动的高效信息检索查询生成摘要 信息检索系统对于有效访问大型文档集合至关重要。最近的方法利用大型语言模型(LLMs)通过查询增强来提高检索性能,但通常依赖于昂贵的监督学习或蒸馏技术,这些技术需要大量的计算资源和手工标注的数据...AI 기술 자료3 개월 전05010
LazyGraphRAG:大幅优化 GraphRAG 的质量与成本GraphRAG 项目 旨在利用非结构化文本中的隐含关系,扩展 AI 系统在私有数据集上可回答问题的范围。 相比传统的向量 RAG(或称“语义搜索”),GraphRAG 的一个关键优势是它能够回答针对...AI 기술 자료# 지식 그래프# 지식 검색 및 RAG 프레임워크3 개월 전04960
为何多智能体协作系统更容易出错?导言 近年来,多智能体系统(MAS)在人工智能领域引起了广泛关注。这些系统通过多个大语言模型(LLM)智能体的协作,试图解决复杂的、多步骤的任务。然而,尽管人们对 MAS 充满期待,其在实际应用中的表...AI 기술 자료2개월 전04940