Tokenization(分词标记化)

Tokenization(分词标记化)

各位好,今天我们要探讨大型语言模型(LLM)中的分词技术。遗憾的是,分词在当前顶尖的LLM中是一个比较复杂且棘手的部分,但理解它的某些细节非常必要,因为很多人将LLM的一些缺点归咎于神经网络或其他显得...
hace 4 meses
01.5K0
多样本(示例)越狱攻击

多样本(示例)越狱攻击

研究人员研究了一种“越狱攻击”技术——这种方法可以被用来绕过大语言模型 (LLM) 开发者设置的安全护栏。这项技术被称为“多样本越狱攻击”,在 Anthropic 自身模型以及其他 AI 公司生产的模...
hace 4 meses
06260
什么是 Transformer?

什么是 Transformer?

Transformer 是一种用于自然语言处理 (NLP) 的深度学习模型架构, 由 Vaswani 等人在 2017 年提出. 它主要用于处理序列到序列的任务, 如机器翻译, 文本生成等. 简单...
hace 4 meses
09500
PDL:声明式提示词编程语言

PDL:声明式提示词编程语言

摘要 大语言模型(LLMs)已在全球引发广泛关注,使得许多以前难以实现的AI应用成为可能。LLM通过高度表达性的文本提示进行控制并返回文本答案。然而,这种输入和输出的不结构化文本使基于LLM的应用程序...
hace 4 meses
01.1K0
CoD:密度链

CoD:密度链

原文:https://arxiv.org/pdf/2309.04269 速读:《从稀疏到密集:使用链式密度提示的GPT-4摘要生成》 收录到:总结知识常用prompts 摘要 在自动文本摘要中,确...
hace 4 meses
07240