エージェント型AI、AIエージェント、エージェント:概念的説明近期,自主型 AI (Agentic AI)、AI 智能体 (AI Agents) 和 智能体 (Agents) 这几个术语频繁出现在大众视野中。坦率地说,尽管身为数据分析师和科学家,业界人士过去对这...AI知識ベース3ヶ月前04830
OpenAIリリース:大規模言語モデルはどのように自分自身を監視して誤動作を防ぐか大型推理模型在有机会时会利用漏洞。研究表明,可以使用大型语言模型(LLM)监控其思维链(chains-of-thought, CoT)来检测这些利用行为。惩罚模型的“不良想法”并不能阻止大多数不当行为...AI知識ベース3ヶ月前04770
マルチ・エージェント・システム(MAS)へのアプローチ:コラボレーティブなAIの世界多智能体系统 (Multi-Agent System, MAS) 是一个由多个交互的智能体 (Intelligent Agent) 组成的计算系统。多智能体系统可用于解决单个智能体或单体系统难以解决或...AI知識ベース3ヶ月前04740
Nexus:スケーラブルなマルチインテリジェント車体システム構築のための新世代Pythonフレームワーク近年来,随着大型语言模型(LLM)的迅猛发展,多智能体系统(Multi-Agent Systems, MAS)的能力得到了显著提升。这些系统不仅能够自动化执行任务,还展现出接近人类的推理能力。然而,传...AI知識ベース3ヶ月前04520
DeepSearch/DeepResearchにおける最適なテキストセグメントの選択とURLの再配置如果你已经读过 Jina 上一篇经典长文《DeepSearch/DeepResearch 的设计与实现》,那么不妨再深挖一些能大幅提升回答质量的细节。这次,我们将重点关注两个细节: 从长网页提取最优文...AI知識ベース3ヶ月前04450
長文ベクトルモデルは4Kトークンを超えるか?2025 年 2 月发布的 NoLiMA 是一种大语言模型(LLM)长文本理解能力评估方法。不同于传统“大海捞针”(Needle-in-a-Haystack, NIAH)测试依赖关键词匹配的做法,它最...AI知識ベース3ヶ月前04420
IDProtector:AIが生み出すテクノロジーの悪用から肖像画を守る方法1. 背景与问题 随着人工智能(AI)技术的快速发展,尤其是扩散模型的进步,AI已经能够生成非常逼真的人像图片。例如,像InstantID这样的技术,只需要一张照片,就能生成具有相同身份特征的多个新图...AI知識ベース3ヶ月前04290
r1-reasoning-rag:収集した情報からの再帰的推論に基づくRAGの新しいアイデア最近发现了一个开源项目,它提供了一种很好的 RAG 思路,它将 DeepSeek-R1 的推理能力结合 Agentic Workflow 应用于 RAG 检索 项目地址 https://github...AI知識ベース3ヶ月前04220
GTRフレームワーク:異種グラフと階層検索に基づくクロステーブルQ&Aの新しいアプローチ1.はじめに 今日の情報爆発では、大量の知識がウェブページ、ウィキペディア、リレーショナ ルデータベースのテーブルの形で保存されている。しかし、従来の質問応答システムは、複数のテーブルにまたがる複雑なクエリを処理するのに苦労することが多く、人工知能の分野では大きな課題となっている。この課題に対処するため、研究者たちは...AI知識ベース2ヶ月前04190
H-CoTはどのようにビッグモデルの推論プロセスを "ハイジャック "し、セキュリティ防御を突破するのか?引言 你有没有想过,我们现在使用的聊天机器人,比如 OpenAI 的模型,是如何判断一个问题是否安全,是否应该回答的呢? 实际上,这些 大型推理模型 (Large Reasoning Models, ...AI知識ベース#プロンプト脱獄3ヶ月前04150
ゲーム「Clue of Time」において、GRPOがo1、o3-mini、R1をどのように凌駕したか。近年来,人工智能领域在推理能力上取得了显著进展。去年,OpenAI 展示了大型语言模型 (LLMs) 的强大推理潜力后,Google DeepMind、阿里巴巴、DeepSeek 和 Anthropi...AI知識ベース3ヶ月前03940
LLMベースのクエリ展開検索エンジンにキーワードを入力しても、検索結果が自分の求めているものとは違うものになってしまうという状況に陥ったことはないだろうか。あるいは、何かを検索したいが、どのような言葉を使えば最も的確に表現できるのかわからないということはないだろうか。ご心配なく、「クエリ拡張」技術がこれらの問題を解決してくれます。 最近、クエリー拡張...AI知識ベース3ヶ月前03680
GPT-4.1オフィシャル・ティップス・エンジニアリング・ガイド(中国語版)GPT-4.1 系列模型相较于 GPT-4o,在编码、指令遵循和长上下文处理能力上有了显著进步。具体来说,它在代码生成和修复任务上表现更优,能更精确地理解并执行复杂指令,并且可以有效处理更长的输入文本...AI知識ベース2ヶ月前03580
クロード・コードを使いこなす:AIプログラミングの生産性を高める実践ガイド掌握 Claude Code:来自一线的代理式编码实战技巧 Claude Code 是一款面向代理式编码 (Agentic Coding) 的命令行工具。所谓代理式编码,指的是让 AI 具备一定的自主...AI知識ベース2ヶ月前03110
9つの主流ビッグモデル・セキュリティ・フレームワークの徹底分析と比較大規模な言語モデリング技術の急速な発展と幅広い応用に伴い、その潜在的なセキュリティリスクはますます業界の注目の的となっています。このような課題に対処するため、世界トップクラスのテクノロジー企業、標準化団体、研究機関の多くが、独自のセキュリティフレームワークを構築し、公開している。本稿では、その中から9つを分析する。AI知識ベース1ヶ月前03050
大規模言語モデルの創造性を評価する:多肢選択式LoTbenchパラダイムを超えて在大语言模型( LLM )的研究领域,模型的 Leap-of-Thought 能力,即创造力,其重要性不亚于以 Chain-of-Thought 为代表的逻辑推理能力。然而,目前针对 LLM 创造力的...AI知識ベース2ヶ月前02760
ZEP: 知的身体記憶のための時間的知識グラフ・アーキテクチャ概要 我々は、Deep Memory Retrieval (DMR)ベンチマークにおいて現在の最先端システムMemGPTを凌駕する、インテリジェンス向けの新しいメモリレイヤーサービスZepを紹介する。AI知識ベース1ヶ月前02280