Train Your Own DeepSeek R1 Inference Model with Unsloth今天,Unsloth 很高兴地介绍了 Unsloth 的推理功能!DeepSeek 的 R1 研究揭示了一个“顿悟时刻”,其中 R1-Zero 通过使用组相对策略优化 (GRPO) 自主学习分配更多的...AI News4mos ago07340
MathCLUE: DeepSeek R1 Challenges 'National High School Math Contest', Dramatically Outperforms o1MathCLUE「全国高中数学竞赛」介绍:深入评估大模型的竞赛级数学推理能力。测评体系涵盖了高中数学的几何、代数和概率统计等多个代表性维度。 🔥测评模型:DeepSeek-R1(访问地址:chat.d...AI News4mos ago07310
Claude 3.7 Sonnet System Evaluation Report (Chinese version)摘要 本系统卡片介绍了Claude 3.7 Sonnet,这是一种混合推理模型。我们主要关注通过模型训练以及利用周围的安全保障系统和评估来减少危害的措施。 我们基于负责任的扩展政策[1]进行了广泛的评...AI News4mos ago07280
Endbrain Cloud DeepSeek Big Language Models Free Trial, Private Domain Big Model Server Preloaded with Full-Blooded Version of DeepSeek R1!在当今数字化时代,人工智能技术正以前所未有的速度改变着我们的生活和工作方式。在人工智能领域,DeepSeek 大语言模型以其卓越的性能和创新性,迅速成为行业焦点。端脑云 现推出 DeepSeek 模型...AI News4mos ago07270
Baichuan Intelligence Releases Baichuan-Omni-1.5 Omnimodal Large Model, Surpassing GPT-4o Mini in Several Measurements临近年终,国内大模型领域再传喜讯。百川智能近期密集发布多款大模型产品,继全场景深度推理模型Baichuan-M1-preview和医疗增强开源模型Baichuan-M1-14B之后,又重磅推出了全模态...AI News4mos ago07260
Claude 3.7 Sonnet Revealed Early, Anthropic's AI Ambitions Can't Be HiddenAnthropic 公司备受瞩目的 Claude 3.7 Sonnet 模型,在原计划发布日期前夕遭遇意外泄露,如同在平静的 AI 水面投下了一颗重磅炸弹,瞬间引爆了科技行业的关注热潮。 根据目前泄露...AI News4mos ago07220
Anthropic CEO supports U.S. AI hegemony by calling out 'China threat'点评: 1. 抹黑中国AI发展,渲染“中国威胁论” 文章作者站在美国立场,刻意渲染 DeepSeek 等中国AI企业的技术进步对美国的所谓“威胁”,并将其与所谓的“XXX威胁”强行关联,这种论调充斥着...AI News4mos ago07220
It is shown that:RL outperforms SFT in learning generalizable knowledge, especially in multimodal tasks, and exhibits stronger reasoning and visual recognition abilities简介 在人工智能领域,基础模型(如大型语言模型和视觉语言模型)已经成为推动技术进步的核心力量。然而,如何有效地提升这些模型的泛化能力,使其能够适应各种复杂多变的现实场景,仍然是一个重大挑战。当前,监督...AI News4mos ago07200
Former head of OpenAI post-training team describes post-training methods and challenges, PPT goes viral这份文档是 OpenAI 前后训练负责人 Barret Zoph 和 John Schulman(也是 OpenAI 联合创始人)在斯坦福大学演讲的 PPT,主要分享了他们在 OpenAI 开发 Ch...AI News4mos ago07180
Anthropic Releases AI Economic Index Report: How AI is Reshaping the Labor Market人工智能 (AI) 系统在未来几年将深刻地改变人们的工作模式。为了深入理解 AI 对劳动力市场和经济的长期影响,Anthropic 公司启动了 “Anthropic 经济指数” (Anthropic ...AI News4mos ago07140
A Side-by-Side Review of Mainstream AI Deep Search Tools in the Market: DeepSeek R1 Outperforms声明: 本次评测为非官方、主观性评测,结果仅供参考。 内容概要 总结: DeepSeek 官方推出的 DeepSeek R1+ 联网搜索工具,以其简洁易用性,在众多 AI 深度搜索工具中脱颖而出,成为...AI News4mos ago07120
OpenAI is zooming in to revolutionize smartphones with AI hardware!还记得 2007 年,乔布斯拿着初代 iPhone 横空出世,开启了智能手机的新纪元吗?一晃十几年过去了,智能手机虽然越来越强大,但似乎也走到了创新的瓶颈期。就在大家感叹“科技以换壳为本”的时候,Op...AI News4mos ago07070
Claude 3.7 Sonnet and Claude Code: cutting-edge reasoning meets Agentic codingAnthropic 公司于今日发布 Claude 3.7 Sonnet ^1^ ,这不仅是 Anthropic 迄今为止最智能的模型,更标志着市场上首个混合推理模型的诞生。Claude 3.7 Son...AI News4mos ago07060
Wenxin Intelligent Body on-line "appreciation" component, relying on Baidu to distribute traffic lying flat to make money今早收到消息:商业新玩法!赞赏组件内测邀请!恭喜您,获得赞赏组件内测机会!一键开通即可躺赚! 去年早些时候,首席AI分享圈介绍了 文心智能体平台,同时给大家分享一种引流技巧 文心智能体引流提示词:通过...AI News5mos ago07060
OpenAI CEO Looks to AGI Economics: Three Observations Reveal Disruptive Change in the Next Decade作者: OpenAI 首席执行官 Sam Altman OpenAI 的使命是确保通用人工智能(AGI)惠及全人类。 OpenAI 认为,指向 AGI 的系统正逐渐显现,因此理解我们所处的时刻至关重要...AI News4mos ago07020
Arigatou Ziyou-o1 inference model released! First output step-by-step explanation that can be deployed on consumer-grade graphics cards2025开年,AI行业掀起大模型“推理潮”,自OpenAI发布o1后,各式推理模型不断涌现,模型的高阶推理能力迎来爆发增强,其应用价值也愈发获得业界的广泛关注。 近日,网易有道正式推出国内首个输出分步...AI News5mos ago07020
Sesame Releases Conversational Speech Model CSM: Making AI Voice Interaction More Natural近日,由 Brendan Iribe、Ankit Kumar 以及 Sesame 团队发表的一篇博文,介绍了该公司在对话式语音生成领域的最新研究成果——对话式语音模型(Conversational S...AI News3mos ago07010
Anthropic Releases Rule Classifier: Effective Defense Against Jailbreak Attacks on Large Language Models, Participate in Tests for Bonuses!随着人工智能技术的飞速发展,大型语言模型(LLM)正以前所未有的速度改变着我们的生活。然而,技术的进步也带来了新的挑战:LLM 可能会被恶意利用,泄露有害信息,甚至被用于制造化学、生物、放射性和核武器...AI News4mos ago07010
Your exclusive digital person? The ultimate PK of six open source digital person programs: a comparison of results at a glance!最近 AI 圈子里,数字人技术真是火得一塌糊涂,各种“开源最强”的数字人方案层出不穷,让人眼花缭乱。虽然笔者也为大家分享了不少数字人整合包,但是面对如此多的选择,大家难免会感到困惑,不知道哪个才最适合...AI News4mos ago07000