AI知识库 - 第11页

순서대로 정렬

post 업데이트 훑어보기 kudos

Agentic AI、AI Agents与Agents：概念解释

近期，自主型 AI (Agentic AI)、AI 智能体 (AI Agents) 和智能体 (Agents) 这几个术语频繁出现在大众视野中。坦率地说，尽管身为数据分析师和科学家，业界人士过去对这...

AI 기술 자료

3 개월 전

04830

OpenAI发布：大型语言模型如何监控自身的不当行为

大型推理模型在有机会时会利用漏洞。研究表明，可以使用大型语言模型（LLM）监控其思维链（chains-of-thought, CoT）来检测这些利用行为。惩罚模型的“不良想法”并不能阻止大多数不当行为...

AI 기술 자료

3 개월 전

04780

走近多智能体系统（MAS）：协同合作的 AI 世界

多智能体系统 (Multi-Agent System, MAS) 是一个由多个交互的智能体 (Intelligent Agent) 组成的计算系统。多智能体系统可用于解决单个智能体或单体系统难以解决或...

AI 기술 자료

3 개월 전

04760

Nexus：构建可扩展多智能体系统的新一代 Python 框架

近年来，随着大型语言模型（LLM）的迅猛发展，多智能体系统（Multi-Agent Systems, MAS）的能力得到了显著提升。这些系统不仅能够自动化执行任务，还展现出接近人类的推理能力。然而，传...

AI 기술 자료

3 개월 전

04550

DeepSearch/DeepResearch中最优文本段选择和URL重排

如果你已经读过 Jina 上一篇经典长文《DeepSearch/DeepResearch 的设计与实现》，那么不妨再深挖一些能大幅提升回答质量的细节。这次，我们将重点关注两个细节：从长网页提取最优文...

AI 기술 자료

3 개월 전

04460

长文本向量模型在4K Tokens 之外形同盲区？

2025 年 2 月发布的 NoLiMA 是一种大语言模型（LLM）长文本理解能力评估方法。不同于传统“大海捞针”（Needle-in-a-Haystack, NIAH）测试依赖关键词匹配的做法，它最...

AI 기술 자료

3 개월 전

04430

IDProtector：保护人像照片免受AI生成技术滥用的方法

1. 背景与问题随着人工智能（AI）技术的快速发展，尤其是扩散模型的进步，AI已经能够生成非常逼真的人像图片。例如，像InstantID这样的技术，只需要一张照片，就能生成具有相同身份特征的多个新图...

AI 기술 자료

3 개월 전

04310

r1-reasoning-rag：根据收集信息递归推理的 RAG 新思路

最近发现了一个开源项目，它提供了一种很好的 RAG 思路，它将 DeepSeek-R1 的推理能力结合 Agentic Workflow 应用于 RAG 检索项目地址 https://github...

AI 기술 자료

3 개월 전

04220

GTR 框架：基于异构图和分层检索的跨表问答新方法

1. 引言在当今信息爆炸的时代，大量知识以表格形式存储于网页、维基百科和关系型数据库中。然而，传统的问答系统往往难以处理跨多个表格的复杂查询，这成为人工智能领域的一大挑战。为了应对这一难题，研究人员...

AI 기술 자료

2개월 전

04210

H-CoT는 어떻게 빅 모델 추론 프로세스를 '하이재킹'하여 보안 방어를 뚫을 수 있을까요?

引言你有没有想过，我们现在使用的聊天机器人，比如 OpenAI 的模型，是如何判断一个问题是否安全，是否应该回答的呢？实际上，这些大型推理模型 (Large Reasoning Models, ...

AI 기술 자료 # 프롬프트 탈옥

3 개월 전

04150

GRPO 如何在“时间线索”游戏中超越 o1、o3-mini 及 R1

近年来，人工智能领域在推理能力上取得了显著进展。去年，OpenAI 展示了大型语言模型 (LLMs) 的强大推理潜力后，Google DeepMind、阿里巴巴、DeepSeek 和 Anthropi...

AI 기술 자료

3 개월 전

03950

基于LLM的查询扩展 (Query Expansion)

你有没有遇到过这种情况：在搜索引擎里输入一个关键词，结果出来的东西却不是你想要的？或者，你想搜某个东西，但不知道用什么词表达才最准确？别担心，"查询扩展"技术可以帮你解决这些问题。最近，查询扩展这项...

AI 기술 자료

3 개월 전

03680

GPT-4.1 官方提示工程指南（中文版）

GPT-4.1 系列模型相较于 GPT-4o，在编码、指令遵循和长上下文处理能力上有了显著进步。具体来说，它在代码生成和修复任务上表现更优，能更精确地理解并执行复杂指令，并且可以有效处理更长的输入文本...

AI 기술 자료

2개월 전

03600

掌握 Claude Code：提升AI编程效率的实用指南

掌握 Claude Code：来自一线的代理式编码实战技巧 Claude Code 是一款面向代理式编码 (Agentic Coding) 的命令行工具。所谓代理式编码，指的是让 AI 具备一定的自主...

AI 기술 자료

2개월 전

03120

九大主流大模型安全框架深度剖析与对比

随着大型语言模型技术的飞速发展和广泛应用，其潜在的安全风险日益成为业界关注的焦点。为了应对这些挑战，全球众多顶尖科技公司、标准化组织及研究机构纷纷构建并发布了各自的安全框架。本文将梳理并剖析其中九个具...

AI 기술 자료

1개월 전

03070

评估大语言模型的创造力：超越选择题的 LoTbench 范式

在大语言模型（ LLM ）的研究领域，模型的 Leap-of-Thought 能力，即创造力，其重要性不亚于以 Chain-of-Thought 为代表的逻辑推理能力。然而，目前针对 LLM 创造力的...

AI 기술 자료

2개월 전

02770

ZEP：一种用于智能体记忆的时间知识图谱架构

摘要我们介绍了Zep，这是一种新型的智能体记忆层服务，在深度记忆检索（DMR）基准测试中，其性能超越了当前最先进的系统MemGPT。此外，Zep在比DMR更全面、更具挑战性的评估中表现出色，这些评估...

AI 기술 자료

1개월 전

02310

그게 아닙니다.