キュー・ワード・エンジニアリングの体系的習得-基礎から応用まで(読書時間2時間から)导读 本文档旨在通过一系列提示词示例(部分),帮助读者快速理解并掌握提示词工程的核心概念与应用。这些示例均源自于一篇关于提示工程技术系统综述的学术论文(《The Prompt Report: A Sy...AI知識ベース4ヶ月前06200
トークン化各位好,今天我们要探讨大型语言模型(LLM)中的分词技术。遗憾的是,分词在当前顶尖的LLM中是一个比较复杂且棘手的部分,但理解它的某些细节非常必要,因为很多人将LLM的一些缺点归咎于神经网络或其他显得...AI知識ベース4ヶ月前01.5K0
ティターンズを徹底解剖:長期記憶の収束と効率的なシーケンス・モデリングへの道《Titans: Learning to Memorize at Test Time》原文:https://arxiv.org/pdf/2501.00663v1 Titans 架构 非官方实现:htt...AI知識ベース4ヶ月前06640
LLM OCRの限界:華やかさの下にある文書解析の課題对于任何需要检索增强生成 (RAG) 系统的应用来说,将海量 PDF 文档变成机器能读懂的文本块(也就是 “PDF 分块”)都是个让人头疼的大难题。 市面上既有开源的方案,也有商业化的产品,但说实话...AI知識ベース4ヶ月前07650
マルチブック(例)脱獄攻撃研究人员研究了一种“越狱攻击”技术——这种方法可以被用来绕过大语言模型 (LLM) 开发者设置的安全护栏。这项技术被称为“多样本越狱攻击”,在 Anthropic 自身模型以及其他 AI 公司生产的模...AI知識ベース4ヶ月前06180
ChatGPT カスタムコマンド FAQ概述 自定义指令功能让您可以分享您希望ChatGPT在回应中考虑的任何信息。 您的指令将应用于新的对话中。 可用性 所有终端 网络、iOS 和 Android 您的数据的使用方式 您可以随时为...AI知識ベース4ヶ月前01.2K0
AIフィルターのセキュリティホールを暴く:文字コードによる制限回避の徹底研究はじめに 先週リリースされた中国製大型言語モデル「DeepSeek-R1」に関するニュース、賞賛、苦情、憶測で、ここ数日、他の多くの人々と同様、私のニュースツイートは埋め尽くされている。このモデル自体は、OpenAIやMeta...AI知識ベース#プロンプト脱獄4ヶ月前08600
OpenAI o3-miniシステムマニュアル(中国語)原文:https://cdn.openai.com/o3-mini-system-card.pdf 1 引言 OpenAI o 模型系列使用大规模强化学习进行训练,以使用思维链进行推理。这些先进的推理...AI知識ベース4ヶ月前09710
チンチラの瞬間とo3の瞬間:ビッグ言語モデルのスケール法則の進化クイック・リーディング 大規模言語モデル(LLM)のスケーリング法則の過去と現在、そしてAI研究の今後の方向性を包括的かつ詳細に考察。著者のキャメロン・R・ウルフは、明確なロジックと豊富な...AI知識ベース4ヶ月前08750
知的エージェントによる検索機能強化世代:エージェントRAG技術の概要概要 OpenAIのGPT-4、GoogleのPaLM、MetaのLLaMAなどの大規模言語モデル(LLM)は、人間のようなテキスト生成と自然言語理解を可能にすることで、人工知能(AI)を劇的に変化させてきた。しかし、静的な学習データに依存する...AI知識ベース4ヶ月前08820
LangGraph: 有向非循環グラフトポロジーに基づくAIエージェント構築・実行フレームワーク人工知能(AI)は急速に成長している分野である。言語モデルは、AIエージェントが複雑なタスクを実行し、複雑な意思決定を行えるように進化してきた。しかし、これらのエージェントのスキルが成長し続けるにつれ、それをサポートするインフラは追いつくのに苦労している。 LangGraphは...AI知識ベース4ヶ月前01.2K0
分かりやすい記事 知識の蒸留(ディスティレーション):「小さなモデル」にも「大きな知恵」を持たせよう。知識蒸留は、事前に訓練された大きなモデル(すなわち「教師モデル」)から、より小さな「生徒モデル」へと学習を移行させることを目的とした機械学習技術である。蒸留技術は、知的対話、コンテンツ作成、その他の分野のための軽量な生成モデルの開発に役立つ。 最近 ...AI知識ベース4ヶ月前01.1K0
トランスフォーマーとは? Transformer 是一种用于自然语言处理 (NLP) 的深度学习模型架构, 由 Vaswani 等人在 2017 年提出. 它主要用于处理序列到序列的任务, 如机器翻译, 文本生成等. 简单...AI知識ベース4ヶ月前09320
CoRAG: MCTS(モンテカルロ・ツリー)を用いた動的連鎖RAGモデリング CORAGの主な貢献の要約 CORAG(Cost-Constrained Retrieval Optimization for Retrieval-Augmented Generation)は、...AI知識ベース4ヶ月前09080
また、7B、13B、65Bは何を表しているのでしょうか?近年、大規模モデルの学習や推論に携わる多くの人々が、モデルのパラメータ数とモデルサイズの関係について議論している。例えば、有名なアルパカシリーズのLLaMAラージモデルでは、LLaMA-7B、LLaMA-13B、LLaMA-33B、LLaMA...AI知識ベース4ヶ月前01.3K0
PDL: 宣言型プロンプト・ワード・プログラミング言語摘要 大语言模型(LLMs)已在全球引发广泛关注,使得许多以前难以实现的AI应用成为可能。LLM通过高度表达性的文本提示进行控制并返回文本答案。然而,这种输入和输出的不结构化文本使基于LLM的应用程序...AI知識ベース4ヶ月前01.1K0
CLOB: キューワードのみを用いた大規模言語モデルによる一連のタスクの連続学習元記事:https://arxiv.org/pdf/2412.15479 解釈:この記事自体はあまり革新的ではなく、応用も利かない。しかし、ずっとずっと昔に読んだ非常に有益な3つの記事を思い起こさせ、前の3つの記事と合わせてこの記事を読むことで、うまくいけば...。AI知識ベース4ヶ月前07380
CoD:密度の連鎖原文:https://arxiv.org/pdf/2309.04269 速读:《从稀疏到密集:使用链式密度提示的GPT-4摘要生成》 收录到:总结知识常用prompts 摘要 在自动文本摘要中,确...AI知識ベース4ヶ月前07180