Tokenization(分词标记化)

Tokenization

各位好,今天我们要探讨大型语言模型(LLM)中的分词技术。遗憾的是,分词在当前顶尖的LLM中是一个比较复杂且棘手的部分,但理解它的某些细节非常必要,因为很多人将LLM的一些缺点归咎于神经网络或其他显得...
4mos ago
01.5K0
OpenAI 函数调用(Function calling)

OpenAI Function calling

OpenAI Function calling V2 特点 Function calling V2 的核心目标是赋予 OpenAI 模型与外部世界交互的能力,主要体现在以下两个核心功能: 数据获取 ...
4mos ago
07640
多样本(示例)越狱攻击

Multibook (example) jailbreak attack

研究人员研究了一种“越狱攻击”技术——这种方法可以被用来绕过大语言模型 (LLM) 开发者设置的安全护栏。这项技术被称为“多样本越狱攻击”,在 Anthropic 自身模型以及其他 AI 公司生产的模...
4mos ago
06260
ChatGPT自定义指令常见问题解答

ChatGPT Customized Command FAQs

概述 自定义指令功能让您可以分享您希望ChatGPT在回应中考虑的任何信息。 您的指令将应用于新的对话中。 可用性 所有终端 网络、iOS 和 Android 您的数据的使用方式 您可以随时为...
4mos ago
01.2K0
什么是 Transformer?

What is Transformer?

Transformer 是一种用于自然语言处理 (NLP) 的深度学习模型架构, 由 Vaswani 等人在 2017 年提出. 它主要用于处理序列到序列的任务, 如机器翻译, 文本生成等. 简单...
4mos ago
09500
PDL:声明式提示词编程语言

PDL: Declarative Prompted Word Programming Language

摘要 大语言模型(LLMs)已在全球引发广泛关注,使得许多以前难以实现的AI应用成为可能。LLM通过高度表达性的文本提示进行控制并返回文本答案。然而,这种输入和输出的不结构化文本使基于LLM的应用程序...
4mos ago
01.1K0
CoD:密度链

CoD: Chain of Density

原文:https://arxiv.org/pdf/2309.04269 速读:《从稀疏到密集:使用链式密度提示的GPT-4摘要生成》 收录到:总结知识常用prompts 摘要 在自动文本摘要中,确...
4mos ago
07240