ZEP: 知的身体記憶のための時間的知識グラフ・アーキテクチャ概要 我々は、Deep Memory Retrieval (DMR)ベンチマークにおいて現在の最先端システムMemGPTを凌駕する、インテリジェンス向けの新しいメモリレイヤーサービスZepを紹介する。AI知識ベース3週間前01860
9つの主流ビッグモデル・セキュリティ・フレームワークの徹底分析と比較大規模な言語モデリング技術の急速な発展と幅広い応用に伴い、その潜在的なセキュリティリスクはますます業界の注目の的となっています。このような課題に対処するため、世界トップクラスのテクノロジー企業、標準化団体、研究機関の多くが、独自のセキュリティフレームワークを構築し、公開している。本稿では、その中から9つを分析する。AI知識ベース4週間前02350
大規模言語モデルの創造性を評価する:多肢選択式LoTbenchパラダイムを超えて在大语言模型( LLM )的研究领域,模型的 Leap-of-Thought 能力,即创造力,其重要性不亚于以 Chain-of-Thought 为代表的逻辑推理能力。然而,目前针对 LLM 创造力的...AI知識ベース1ヶ月前02190
クロード・コードを使いこなす:AIプログラミングの生産性を高める実践ガイド掌握 Claude Code:来自一线的代理式编码实战技巧 Claude Code 是一款面向代理式编码 (Agentic Coding) 的命令行工具。所谓代理式编码,指的是让 AI 具备一定的自主...AI知識ベース1ヶ月前02520
GPT-4.1オフィシャル・ティップス・エンジニアリング・ガイド(中国語版)GPT-4.1 系列模型相较于 GPT-4o,在编码、指令遵循和长上下文处理能力上有了显著进步。具体来说,它在代码生成和修复任务上表现更优,能更精确地理解并执行复杂指令,并且可以有效处理更长的输入文本...AI知識ベース1ヶ月前02900
GTRフレームワーク:異種グラフと階層検索に基づくクロステーブルQ&Aの新しいアプローチ1.はじめに 今日の情報爆発では、大量の知識がウェブページ、ウィキペディア、リレーショナ ルデータベースのテーブルの形で保存されている。しかし、従来の質問応答システムは、複数のテーブルにまたがる複雑なクエリを処理するのに苦労することが多く、人工知能の分野では大きな課題となっている。この課題に対処するため、研究者たちは...AI知識ベース2ヶ月前03680
EQ-Bench 大規模言語モデルにおける感情的知性と創造性の評価方法随着大型语言模型 (LLM) 能力的飞速发展,传统的基准测试,如 MMLU,在区分顶尖模型方面逐渐显现出局限性。仅仅依靠知识问答或标准化测试,已难以全面衡量模型在真实世界交互中至关重要的细微能力,例如...AI知識ベース2ヶ月前05410
大きな言語モデルによる推論:「アンダーシンキング」と「オーバーシンキング」のバランス大语言模型(LLM)的发展日新月异,其推理能力已成为衡量其智能水平的关键指标。特别是具备长推理能力的模型,例如 OpenAI 的 o1、DeepSeek-R1、QwQ-32B 和 Kimi K1.5 ...AI知識ベース2ヶ月前04820
uv共通コマンドPython 生态向来不缺包管理和环境管理工具,从经典的 pip、virtualenv 到 pip-tools、conda,再到现代化的 Poetry、PDM 等等。每种工具都有其擅长的领域,但也常常...AIハンズオンチュートリアルAI知識ベース2ヶ月前05290
ツール呼び出しのボトルネックを解消:CoToolsフレームワークで大規模言語モデルが大量のツールを効率的に利用可能に引言 近年来,大型语言模型(LLMs)在人工智能领域取得了令人瞩目的进展,其强大的语言理解和生成能力使其在多个领域得到了广泛应用。然而,LLMs 在处理需要调用外部工具的复杂任务时,仍然面临诸多挑战...AI知識ベース2ヶ月前04750
なぜマルチインテリジェンス協調システムはエラーを起こしやすいのか?导言 近年来,多智能体系统(MAS)在人工智能领域引起了广泛关注。这些系统通过多个大语言模型(LLM)智能体的协作,试图解决复杂的、多步骤的任务。然而,尽管人们对 MAS 充满期待,其在实际应用中的表...AI知識ベース2ヶ月前04310
Anthropic Deep Dive Claude:大規模言語モデルにおける意思決定と推論プロセスの解明像 Claude 这样的大型语言模型 (LLM) 并非由人类直接编写程序代码造就,它们是在海量数据中训练出来的。在这个过程中,模型自己学会了解决问题的策略。这些策略隐藏在模型生成每个词时进行的数十亿次...AI知識ベース2ヶ月前04440
AIに立ち止まって考えさせる:Anthropicの "Think "ツールがクロードの推論を強化する方法近期,Anthropic 公司推出了一种名为 "think" 的新工具,旨在增强 Claude 模型在复杂问题解决方面的能力。本文将深入探讨 "think" 工具的设计理念、性能表现以及实际应用中的最...AI知識ベース2ヶ月前04960
DeepRetrieval:強化学習による効率的な情報検索クエリ生成摘要 信息检索系统对于有效访问大型文档集合至关重要。最近的方法利用大型语言模型(LLMs)通过查询增强来提高检索性能,但通常依赖于昂贵的监督学习或蒸馏技术,这些技术需要大量的计算资源和手工标注的数据...AI知識ベース2ヶ月前04400
OpenAIリリース:大規模言語モデルはどのように自分自身を監視して誤動作を防ぐか大型推理模型在有机会时会利用漏洞。研究表明,可以使用大型语言模型(LLM)监控其思维链(chains-of-thought, CoT)来检测这些利用行为。惩罚模型的“不良想法”并不能阻止大多数不当行为...AI知識ベース2ヶ月前04160
[再掲】QwQ-32Bのツール呼び出し機能とエージェント型RAGアプリケーション背景 近期,一篇名为 Search-R1: Training LLMs to Reason and Leverage Search Engines with Reinforcement Learnin...AI知識ベース2ヶ月前04500
LazyGraphRAG:GraphRAGの品質とコストを劇的に最適化するGraphRAG 项目 旨在利用非结构化文本中的隐含关系,扩展 AI 系统在私有数据集上可回答问题的范围。 相比传统的向量 RAG(或称“语义搜索”),GraphRAG 的一个关键优势是它能够回答针对...AI知識ベース#ナレッジグラフ# 知識検索とRAGフレームワーク2ヶ月前04390
DeepSearch/DeepResearchにおける最適なテキストセグメントの選択とURLの再配置如果你已经读过 Jina 上一篇经典长文《DeepSearch/DeepResearch 的设计与实现》,那么不妨再深挖一些能大幅提升回答质量的细节。这次,我们将重点关注两个细节: 从长网页提取最优文...AI知識ベース3ヶ月前03930
ジェンマ3テクニカルレポート中国語版Gemma 3 关键信息总结 一、关键指标 参数 详情 模型规模 1 亿到 270 亿参数,共四个版本:1B、4B、12B、27B 架构 基于 Transformer 的解码器专用架构,继承自 Gem...AI知識ベース3ヶ月前04870