ローディング

AI知識ベース

全207記事

コース情報 AIユーティリティ・コマンド最新のAIツール AI知識ベース AIニュース AIハンズオンチュートリアル AIアンサー

順番に並べる

ポスト更新目を通すクドス

九大主流大模型安全框架深度剖析与对比

9つの主流ビッグモデル・セキュリティ・フレームワークの徹底分析と比較

大規模な言語モデリング技術の急速な発展と幅広い応用に伴い、その潜在的なセキュリティリスクはますます業界の注目の的となっています。このような課題に対処するため、世界トップクラスのテクノロジー企業、標準化団体、研究機関の多くが、独自のセキュリティフレームワークを構築し、公開している。本稿では、その中から9つを分析する。

AI知識ベース

2ヶ月前

0753

评估大语言模型的创造力：超越选择题的 LoTbench 范式

大規模言語モデルの創造性を評価する：多肢選択式LoTbenchパラダイムを超えて

在大语言模型（ LLM ）的研究领域，模型的 Leap-of-Thought 能力，即创造力，其重要性不亚于以 Chain-of-Thought 为代表的逻辑推理能力。然而，目前针对 LLM 创造力的...

AI知識ベース

3ヶ月前

0472

掌握 Claude Code：提升AI编程效率的实用指南

クロード・コードを使いこなす：AIプログラミングの生産性を高める実践ガイド

掌握 Claude Code：来自一线的代理式编码实战技巧 Claude Code 是一款面向代理式编码 (Agentic Coding) 的命令行工具。所谓代理式编码，指的是让 AI 具备一定的自主...

AI知識ベース

3ヶ月前

0520

GPT-4.1 官方提示工程指南（中文版）

GPT-4.1オフィシャル・ティップス・エンジニアリング・ガイド（中国語版）

GPT-4.1 系列模型相较于 GPT-4o，在编码、指令遵循和长上下文处理能力上有了显著进步。具体来说，它在代码生成和修复任务上表现更优，能更精确地理解并执行复杂指令，并且可以有效处理更长的输入文本...

AI知識ベース

3ヶ月前

0530

GTR 框架：基于异构图和分层检索的跨表问答新方法

GTRフレームワーク：異種グラフと階層検索に基づくクロステーブルQ&Aの新しいアプローチ

1.はじめに今日の情報爆発では、大量の知識がウェブページ、ウィキペディア、リレーショナルデータベースのテーブルの形で保存されている。しかし、従来の質問応答システムは、複数のテーブルにまたがる複雑なクエリを処理するのに苦労することが多く、人工知能の分野では大きな課題となっている。この課題に対処するため、研究者たちは...

AI知識ベース

3ヶ月前

0590

EQ-Bench 如何评估大型语言模型的情商与创造力

EQ-Bench 大規模言語モデルにおける感情的知性と創造性の評価方法

随着大型语言模型 (LLM) 能力的飞速发展，传统的基准测试，如 MMLU，在区分顶尖模型方面逐渐显现出局限性。仅仅依靠知识问答或标准化测试，已难以全面衡量模型在真实世界交互中至关重要的细微能力，例如...

AI知識ベース

3ヶ月前

0779

大语言模型推理：在“思考不足”与“过度思考”之间寻求平衡

大きな言語モデルによる推論：「アンダーシンキング」と「オーバーシンキング」のバランス

大语言模型（LLM）的发展日新月异，其推理能力已成为衡量其智能水平的关键指标。特别是具备长推理能力的模型，例如 OpenAI 的 o1、DeepSeek-R1、QwQ-32B 和 Kimi K1.5 ...

AI知識ベース

3ヶ月前

0714

突破工具调用瓶颈：CoTools 框架助力大型语言模型高效利用海量工具

ツール呼び出しのボトルネックを解消：CoToolsフレームワークで大規模言語モデルが大量のツールを効率的に利用可能に

引言近年来，大型语言模型（LLMs）在人工智能领域取得了令人瞩目的进展，其强大的语言理解和生成能力使其在多个领域得到了广泛应用。然而，LLMs 在处理需要调用外部工具的复杂任务时，仍然面临诸多挑战...

AI知識ベース

4ヶ月前

0714

uv常用命令大全

uv共通コマンド

Python 生态向来不缺包管理和环境管理工具，从经典的 pip、virtualenv 到 pip-tools、conda，再到现代化的 Poetry、PDM 等等。每种工具都有其擅长的领域，但也常常...

AIハンズオンチュートリアル AI知識ベース

4ヶ月前

0917

为何多智能体协作系统更容易出错？

なぜマルチインテリジェンス協調システムはエラーを起こしやすいのか？

导言近年来，多智能体系统（MAS）在人工智能领域引起了广泛关注。这些系统通过多个大语言模型（LLM）智能体的协作，试图解决复杂的、多步骤的任务。然而，尽管人们对 MAS 充满期待，其在实际应用中的表...

AI知識ベース

4ヶ月前

0703

Anthropic 深度剖析 Claude：揭示大型语言模型的的决策与推理过程

Anthropic Deep Dive Claude：大規模言語モデルにおける意思決定と推論プロセスの解明

像 Claude 这样的大型语言模型 (LLM) 并非由人类直接编写程序代码造就，它们是在海量数据中训练出来的。在这个过程中，模型自己学会了解决问题的策略。这些策略隐藏在模型生成每个词时进行的数十亿次...

AI知識ベース

4ヶ月前

0675

让 AI 停下来思考：Anthropic

AIに立ち止まって考えさせる：Anthropicの "Think "ツールがクロードの推論を強化する方法

近期，Anthropic 公司推出了一种名为 "think" 的新工具，旨在增强 Claude 模型在复杂问题解决方面的能力。本文将深入探讨 "think" 工具的设计理念、性能表现以及实际应用中的最...

AI知識ベース

4ヶ月前

0730

DeepRetrieval：强化学习驱动的高效信息检索查询生成

DeepRetrieval：強化学習による効率的な情報検索クエリ生成

摘要信息检索系统对于有效访问大型文档集合至关重要。最近的方法利用大型语言模型（LLMs）通过查询增强来提高检索性能，但通常依赖于昂贵的监督学习或蒸馏技术，这些技术需要大量的计算资源和手工标注的数据...

AI知識ベース

4ヶ月前

0680

OpenAI发布：大型语言模型如何监控自身的不当行为

OpenAIリリース：大規模言語モデルはどのように自分自身を監視して誤動作を防ぐか

大型推理模型在有机会时会利用漏洞。研究表明，可以使用大型语言模型（LLM）监控其思维链（chains-of-thought, CoT）来检测这些利用行为。惩罚模型的“不良想法”并不能阻止大多数不当行为...

AI知識ベース

4ヶ月前

0655

[转载]QwQ-32B 的工具调用能力及 Agentic RAG 应用

[再掲】QwQ-32Bのツール呼び出し機能とエージェント型RAGアプリケーション

背景近期，一篇名为 Search-R1: Training LLMs to Reason and Leverage Search Engines with Reinforcement Learnin...

AI知識ベース

4ヶ月前

0750

LazyGraphRAG：大幅优化 GraphRAG 的质量与成本

LazyGraphRAG：GraphRAGの品質とコストを劇的に最適化する

GraphRAGプロジェクトは、構造化されていないテキストに含まれる暗黙的な関係を利用することで、AIシステムがプライベートデータセットに対して回答できる質問の範囲を拡張することを目的としている。従来のベクトルRAG（または「セマンティック検索」）に対するGraphRAGの主な利点は、...

AI知識ベース #ナレッジグラフ # 知識検索とRAGフレームワーク

4ヶ月前

0730

DeepSearch/DeepResearch中最优文本段选择和URL重排

DeepSearch/DeepResearchにおける最適なテキストセグメントの選択とURLの再配置

如果你已经读过 Jina 上一篇经典长文《DeepSearch/DeepResearch 的设计与实现》，那么不妨再深挖一些能大幅提升回答质量的细节。这次，我们将重点关注两个细节：从长网页提取最优文...

AI知識ベース

4ヶ月前

0636

Gemma 3 技术报告中文版

ジェンマ3テクニカルレポート中国語版

Gemma 3 关键信息总结一、关键指标参数详情模型规模 1 亿到 270 亿参数，共四个版本：1B、4B、12B、27B 架构基于 Transformer 的解码器专用架构，继承自 Gem...

AI知識ベース

4ヶ月前

0823

IDProtector：保护人像照片免受AI生成技术滥用的方法

IDProtector：AIが生み出すテクノロジーの悪用から肖像画を守る方法

1. 背景与问题随着人工智能（AI）技术的快速发展，尤其是扩散模型的进步，AI已经能够生成非常逼真的人像图片。例如，像InstantID这样的技术，只需要一张照片，就能生成具有相同身份特征的多个新图...

AI知識ベース

4ヶ月前

0608

もっと読む