DeepSeek-R1-0528 - DeepSeek开源的R1最新版 AI 模型

373 0

DeepSeek-R1-0528是什么

DeepSeek-R1-0528 是 DeepSeek 团队最新推出的 AI 模型，模型基于 DeepSeek-V3-0324 训练，参数量高达 660B，性能显著提升。模型在 HuggingFace 上开源，支持开发者自由使用、修改。模型核心亮点包括强大的深度推理能力，支持处理复杂的多步骤逻辑问题，优化的文本生成，让输出更自然、格式更佳，模型支持长达 30-60 分钟的单任务处理，适合复杂任务。在编程任务上，DeepSeek-R1-0528 表现卓越，特别是在复杂任务处理和代码生成方面，超越 Claude 4 Sonnet 和 Gemini 2.5 Pro 等顶流大模型。模型目前支持在官网、APP 、小程序（开启深度思考功能）和API 接口体验。

DeepSeek-R1-0528 - DeepSeek开源的R1最新版 AI 模型

DeepSeek-R1-0528的主要功能

深度推理：支持处理复杂的逻辑推理和多步骤思考，有效解决复杂问题。
编程能力：能生成高质量代码，支持多种编程任务，包括模拟物理现象、前端设计等。
文本生成：支持生成自然流畅的文本，格式规范，适用各类写作任务。
长时间思考：单任务处理时间达30至60分钟，非常适合处理复杂任务。

DeepSeek-R1-0528的官网地址

HuggingFace模型库：https://huggingface.co/deepseek-ai/DeepSeek-R1-0528

如何使用DeepSeek-R1-0528

官方网站访问：访问 DeepSeek 的官方网站。按照提示进行操作，开启深度思考功能开始测试。
APP 访问：下载安装 DeepSeek 官方 APP，iOS用户访问苹果AppStore应用商店，安卓用户访问腾讯应用宝下载并安装。在 APP 的主界面，开启深度思考功能进入使用。
小程序访问：微信搜索DeepSeek小程序。在小程序的主界面开启深度思考功能开始测试，点击进入使用。
API 接口访问：开发者基于 DeepSeek 提供的 API 接口访问 R1 模型。注册并获取 API 密钥（API Key）。基于 API 密钥，按照文档中的说明调用 R1 模型的接口，进行测试和开发。

DeepSeek-R1-0528的核心优势

深度推理能力：擅长复杂逻辑和多步骤思考，适合解决难题。
卓越的编程能力：生成高质量代码，支持多种编程任务。
优化文本生成：输出自然流畅，格式规范，适合写作任务。
开源灵活：基于 MIT 协议开源，便于开发者使用和修改。
多任务处理：适应多种任务，切换高效，输出稳定。

DeepSeek-R1-0528的性能表现

编程能力：在 LiveCodeBench 基准测试中，DeepSeek-R1-0528 的性能表现极为出色，几乎与 OpenAI 的 o3-high 持平，甚至在某些方面超越了 Claude 4 Sonnet 和 Gemini 2.5 Pro 等其他顶尖大模型。
数学推理：在 AIME 2025 测试中，DeepSeek-R1-0528 的准确率从旧版的 70% 显著提升至 87.5%，显示出在复杂数学问题解决上的显著进步。在 AIME 2024 测试中，基于 DeepSeek-R1-0528 蒸馏训练的 DeepSeek-R1-0528-Qwen3-8B 表现优异，仅次于 DeepSeek-R1-0528 本身，超越 Qwen3-8B（+10.0%），与 Qwen3-235B 相当。
工具调用：在 Tau-Bench 测评中，DeepSeek-R1-0528 的表现与 OpenAI 的 o1-high 相当，但与 o3-High 和 Claude 4 Sonnet 仍有差距。