Gemini 2.5 Deep Think - 谷歌推出的AI推理模型

Gemini 2.5 Deep Think是什么

쌍둥이자리 2.5 Deep Think 是谷歌推出的 AI 推理模型,专为解决复杂任务设计。是获得 2025 年国际数学奥林匹克竞赛(IMO)金牌的模型的变体,通过并行思考技术(Parallel Thinking)和强化学习,能同时探索多种解法,互相验证并优化,最终得出最佳答案。Deep Think 特别擅长处理复杂的数学问题、算法设计、科研推理和创意开发任务。在性能上,Deep Think 在多个基准测试中表现出色,例如在 HLE 测试中取得 34.8% 的最高分,在 AIME 2025 中接近满分,在 LiveCodeBench V6 中也取得了 87.6% 的高分。能生成更详细、更具创造性的输出,在复杂任务中表现出色。Deep Think 仅向 Google AI Ultra 订阅用户开放,月费为 249.99 美元(约 1800 元人民币),每天有固定的使用额度。

Gemini 2.5 Deep Think - 谷歌推出的AI推理模型

Gemini 2.5 Deep Think的主要功能

  • 并行思考:Deep Think 通过并行思考技术,能同时生成多个想法并进行评估。会同时探索多种解法,互相验证并优化,最终得出最佳答案。类似于人类在解决复杂问题时的多角度思考。
  • 强化学习:通过新的强化学习技术,Deep Think 能随着时间推移不断优化其推理路径,变得更擅长解决问题。
  • 数学与算法:Deep Think 在数学和算法设计方面表现出色。能解决复杂的数学问题,例如在 2025 年国际数学奥林匹克竞赛(IMO)中获得金牌,并在 AIME 2025 中接近满分。
  • 科研推理:Deep Think 可以帮助研究人员提出和验证数学猜想,推理复杂的科学文献,加速科学发现的进程。
  • 迭代开发:Deep Think 在需要分步骤构建复杂事物的任务中表现出色。例如,在网页设计、游戏场景建模和产品原型优化中,能同时提升项目的美观度和功能性。
  • 体素艺术:在生成复杂的创意设计(如体素艺术)时,Deep Think 能生成更丰富、更详细的输出,相比其他版本的 Gemini 模型,细节和美感显著提升。
  • 高难度编程问题:Deep Think 在处理需要精确问题表述、权衡取舍和时间复杂度的编程问题时表现出色。能帮助程序员拆解问题、算法建模,逐步逼近最优解。
  • 代码优化:在 LiveCodeBench V6 测试中,Deep Think 取得了 87.6% 的高分,显示出其在代码优化和算法设计方面的强大能力。
  • 内容安全性和客观性:Deep Think 的内容安全性和客观性相比 Gemini 2.5 Pro 有所提升,能更好地处理敏感和复杂的内容。
  • 拒绝良性请求:虽然拒绝良性请求的倾向有所增强,确保了模型在处理复杂任务时的严谨性和安全性。

Gemini 2.5 Deep Think的项目地址

  • 프로젝트 웹사이트:https://blog.google/products/gemini/gemini-2-5-deep-think/
  • 기술 문서:https://storage.googleapis.com/deepmind-media/Model-Cards/Gemini-2-5-Deep-Think-Model-Card.pdf

如何使用Gemini 2.5 Deep Think

  • 前提条件
    • 订阅 Google AI Ultra:Deep Think 仅对 Google AI Ultra 订阅用户开放。订阅费用为每月 249.99 美元(约合人民币 1800 元)。用户需访问 ai.google.com,使用 Google 账号登录,选择 AI Ultra 计划并完成支付。需要注意的是,Google AI Ultra 目前仅在部分国家和地区提供服务,中国大陆用户可能需要使用特殊网络环境才能访问,且支付方式仅支持主要的国际信用卡。
    • 年满 18 周岁:使用 Deep Think 功能需要用户年满 18 岁。
    • 登录 Gemini 应用:用户需登录 Gemini 应用,目前无法通过工作/学校 Google 账号使用此功能。
  • 开启 Deep Think 模式
    • 모델 선택:打开 gemini.google.com 或手机上的 Gemini 应用,在模型选择下拉菜单中选择 “Gemini 2.5 Pro”。
    • 启用 Deep Think:在输入框上方,点击 “思考模式” 开关或者大脑图标,手动启用 Deep Think。
    • 입력 문제:在底部的文本框中输入需要解决的复杂问题。
    • 发送问题:检查 Deep Think 图标是否已经点亮(通常会显示为蓝色或紫色),然后点击发送。
    • 等待回答:Deep Think 生成回答可能需要 30 秒到 5 分钟不等,具体取决于问题的复杂度。在等待期间,用户可以看到思考进度的可视化展示,能看到它正在探索的不同思路。用户也可以退出当前对话并开始新的对话。回答完毕后,Gemini 会通知用户。在 Web 应用中,相应对话串旁会显示通知;在移动应用中,通知会显示为设备通知。

Gemini 2.5 Deep Think的技术原理

  • 多线程推理:Deep Think 可以同时生成并考量多种思路,随着时间推移修订或融合不同想法,最终得出最佳答案。
  • 延长思考时间:通过延长推理时间,模型有更多机会探索不同的假设,为复杂问题找到更具创造性的解决方案。
  • 优化推理路径:强化学习技术使 Deep Think 能随着时间推移不断优化其推理路径,成为更出色、更直观的问题解决者。
  • 动态调整:用户可以设置思考预算来平衡性能和成本。
  • 稀疏混合专家(MoE)架构:Deep Think 基于稀疏混合专家架构,允许模型激活每个输入 토큰 的模型参数子集。具体特点包括:
    • 动态路由:模型通过学习将 token 动态路由到参数子集(专家),在总模型容量与每个 token 的计算和服务成本之间解耦。
    • 高效计算:这种架构使模型能够高效地处理大规模输入,同时保持高性能。

Gemini 2.5 Deep Think与 Gemini 2.5 Pro 对比

能力/属性Gemini 2.5 ProGemini 2.5 Deep Think
推理速度快速,低延迟较慢,延长“思考时间”
推理复杂度中等高,使用并行思维
提示深度和创造力良好更详细、更细致
基准测试表现强劲状态最先进的
内容安全与客观性相比旧模型有所改进进一步改进
拒绝率(良性提示)较低较高
输出长度标准支持更长的响应
体素艺术/设计保真度基本场景结构增强的细节和丰富性

Gemini 2.5 Deep Think的应用场景

Gemini 2.5 Deep Think的应用场景包括:数学与算法,在国际数学奥林匹克竞赛(IMO)中达到金牌水平,在 AIME 2025 中接近满分。科研推理,帮助研究人员提出和验证数学猜想,推理复杂科学文献。创意与设计,在网页设计、游戏场景建模等任务中表现出色,能生成更丰富、更详细的输出。学生和教育工作者,辅助解决复杂的数学和科学问题。

© 저작권 정책
AiPPT

관련 문서

댓글 없음

您必须登录才能参与评论!
立即登录
없음
댓글 없음...