AI新闻 - 第13页

순서대로 정렬

post 업데이트 훑어보기 kudos

DeepSeek：被媒体忽视的问题

特邀撰稿人 Lennart Heim 和 Sihao Huang，本文交叉发布于 Lennart 的个人博客。Lennart 是 ChinaTalk 的常客，最近曾参与关于测试时计算时代的地缘政治的讨...

AI 뉴스

4개월 전

07190

Mistral 发布开源 Mistral Small 3：性能媲美 GPT-4o，速度超越 Llama 3

Mistral Small 3：Apache 2.0 协议，81% MMLU，150 tokens/秒今天，Mistral AI 推出 Mistral Small 3，这是一款延迟优化的 240 亿...

AI 뉴스

4개월 전

05950

分析师Alberto Romero猜测：其实OpenAI的GPT-5早就有了

让我们以激动人心的方式开启新的一年可能由 GPT-5 生成如果我告诉你 GPT-5 是真实存在的。不仅是真实的，而且已经在你看不见的地方塑造世界。这里有个假设：OpenAI 已经开发了 GPT...

AI 뉴스

4개월 전

07660

微软 Azure+Copilot+AI PC 产品全线支持 DeepSeek R1 模型

Microsoft Azure+Copilot+AI PC 제품, DeepSeek R1 모델 완벽 지원

2025 年 1 月 30 日，微软表示，DeepSeek 的 R1 模型已在其 Azure 云计算平台和面向广大开发人员的 GitHub 工具上可供使用。微软还表示，客户很快就可以在他们的 Copi...

AI 뉴스

4개월 전

08170

Anthropic CEO 妄言“中国威胁”，为美国 AI 霸权主义撑腰

点评： 1. 抹黑中国AI发展，渲染“中国威胁论” 文章作者站在美国立场，刻意渲染 DeepSeek 等中国AI企业的技术进步对美国的所谓“威胁”，并将其与所谓的“XXX威胁”强行关联，这种论调充斥着...

AI 뉴스

4개월 전

07010

哈佛发布生成式AI学生应用指南，提出四项建议和33个策略

2025年1月17日，哈佛大学教育研究生院（Harvard Graduate School of Education）发布《学生自主项目中的GenAI：建议和启示》指南，该指南由哈佛创意计算实验室（C...

AI 뉴스

4개월 전

07790

复现DeepSeek-R1：8K数学示例助力小型模型通过强化学习实现推理突破

Github: https://github.com/hkust-nlp/simpleRL-reason 这篇博客将展示一个对DeepSeek-R1-Zero 和 DeepSeek-R1训练的复现...

AI 뉴스

4개월 전

09270

基于MoE架构的Qwen2.5-Max全面超越DeepSeek V3

模型概览近年来，基于混合专家系统（Mixture of Experts，MoE）架构的大模型训练成为人工智能领域的重要研究方向。Qwen团队近期发布的Qwen2.5-Max模型，采用超过20万亿to...

AI 뉴스

4개월 전

01.1K0

LLM 蒸馏：一场关于大模型独立性的“暗战”？

一、背景与挑战随着人工智能技术的飞速发展，大型语言模型（LLM）已成为自然语言处理领域的核心驱动力。然而，训练这些模型需要巨大的计算资源和时间成本，这促使了知识蒸馏（KD）技术的兴起。知识蒸馏通过...

AI 뉴스

4개월 전

07490

新年好礼：赠送价值799的 COZE 零基础设计自动化工作流课程

全部可课程包含：基础入门+自动化工作流实战课30节基础课-Coze零基础开发Agent智能体-54节 https://pan.quark.cn/s/931e5e153f4d#/list/s...

AI 뉴스

4개월 전

06500

DeepSeek暂时限制了新的注册，理由是“大规模恶意攻击”

DeepSeek 遭遇大规模恶意攻击，暂时限制了新的注册，原因是其线上服务受到攻击，导致注册过程繁忙。此问题约2025年1月27日由 deepseek api 报错开始爆发，期间注册也出现小规模问题...

AI 뉴스

4개월 전

08890

Qwen2.5-VL 发布：支持长视频理解、视觉定位、结构化输出，开源可微调

1.模型介绍自 Qwen2-VL 发布以来的五个月里，众多开发者在 Qwen2-VL 视觉语言模型上构建了新模型，为Qwen团队提供了宝贵的反馈。在此期间，Qwen团队专注于构建更有用的视觉语言模型...

AI 뉴스

4개월 전

01.3K0

DeepSeek发布统一多模态理解与生成模型：从 JanusFlow 到 Janus-Pro

JanusFlow 速读 DeepSeek 团队又发新模型，28日凌晨推出了创新型多模态框架 Janus-Pro，这是一个能同时处理多模态理解和生成任务的统一模型。该模型基于 DeepSeek-LLM...

AI 뉴스

4개월 전

09700

百川智能发布Baichuan-Omni-1.5全模态大模型，多项测评超越GPT-4o Mini

临近年终，国内大模型领域再传喜讯。百川智能近期密集发布多款大模型产品，继全场景深度推理模型Baichuan-M1-preview和医疗增强开源模型Baichuan-M1-14B之后，又重磅推出了全模态...

AI 뉴스

4개월 전

07130

DeepSeek：中国开源AI飓风席卷硅谷，重塑全球AI格局

今日，中国AI领域冉冉升起的新星 DeepSeek，以其惊人的速度和实力，在全球范围内引发了一场科技界的“地震”。这款被誉为“国产AI之光”的应用，不仅在美区App Store免费榜上力压 ChatG...

AI 뉴스

4개월 전

09270

深度分析丨下一个3000亿美元Agents市场，附案例分析

2024年末，YC 合伙人 Jared 预测未来几年，垂直领域 AI Agent 将是比 SaaS 大10倍的新兴市场，这个领域还可能催生市值超过3000亿美元的科技巨头。届时，微软 CEO Saty...

AI 뉴스

4개월 전

07160

大模型能理解多长的视频？智谱 GLM-4V-Plus：2小时

在前两代视频模型（CogVLM2-Video和GLM-4V-PLUS）的基础上，我们进一步优化了视频理解技术，推出了GLM-4V-Plus-0111 beta版本。该版本引入了原生可变分辨率等技术，提...

AI 뉴스

4개월 전

07540

Qwen2.5-1M: 支持100万Tokens上下文的开源Qwen模型

1.引言两个月前，Qwen团队升级了 Qwen2.5-Turbo，使其支持最多一百万个Tokens的上下文长度。今天，Qwen正式推出开源的 Qwen2.5-1M 模型及其对应的推理框架支持。以下是...

AI 뉴스

4개월 전

09920

有道子曰-o1推理模型发布！首个输出分步式讲解，消费级显卡即可部署

2025开年，AI行业掀起大模型“推理潮”，自OpenAI发布o1后，各式推理模型不断涌现，模型的高阶推理能力迎来爆发增强，其应用价值也愈发获得业界的广泛关注。近日，网易有道正式推出国内首个输出分步...

AI 뉴스

4개월 전

06760