DeepSeek:メディアが無視する問題特邀撰稿人 Lennart Heim 和 Sihao Huang,本文交叉发布于 Lennart 的个人博客。Lennart 是 ChinaTalk 的常客,最近曾参与关于测试时计算时代的地缘政治的讨...AIニュース4ヶ月前07190
ミストラル、オープンソースのミストラル・スモール3をリリース:性能はGPT-4oに匹敵し、ラマ3を上回るMistral Small 3:Apache 2.0 协议,81% MMLU,150 tokens/秒 今天,Mistral AI 推出 Mistral Small 3,这是一款延迟优化的 240 亿...AIニュース4ヶ月前05950
アナリストのアルベルト・ロメロは、OpenAIのGPT-5の登場はかなり遅れていると推測している。让我们以激动人心的方式开启新的一年 可能由 GPT-5 生成 如果我告诉你 GPT-5 是真实存在的。不仅是真实的,而且已经在你看不见的地方塑造世界。这里有个假设:OpenAI 已经开发了 GPT...AIニュース4ヶ月前07660
Microsoft Azure+Copilot+AI PC製品がDeepSeek R1モデルを完全サポート2025 年 1 月 30 日,微软表示,DeepSeek 的 R1 模型已在其 Azure 云计算平台和面向广大开发人员的 GitHub 工具上可供使用。微软还表示,客户很快就可以在他们的 Copi...AIニュース4ヶ月前08170
Anthropic社CEO、「中国の脅威」を訴えて米国のAI覇権を支持点评: 1. 抹黑中国AI发展,渲染“中国威胁论” 文章作者站在美国立场,刻意渲染 DeepSeek 等中国AI企业的技术进步对美国的所谓“威胁”,并将其与所谓的“XXX威胁”强行关联,这种论调充斥着...AIニュース4ヶ月前07000
ハーバード大学、4つの提言と33の戦略を盛り込んだジェネレーティブAI学生応募ガイドを発表2025年1月17日,哈佛大学教育研究生院(Harvard Graduate School of Education)发布《学生自主项目中的GenAI:建议和启示》指南,该指南由哈佛创意计算实验室(C...AIニュース4ヶ月前07790
DeepSeek-R1の複製:8Kの数学的事例が強化学習による推論のブレークスルーを小さなモデルにもたらすGithub: https://github.com/hkust-nlp/simpleRL-reason 这篇博客将展示一个对DeepSeek-R1-Zero 和 DeepSeek-R1训练的复现...AIニュース4ヶ月前09270
MoE アーキテクチャに基づく Qwen2.5-Max が DeepSeek V3 を完全に凌駕模型概览 近年来,基于混合专家系统(Mixture of Experts,MoE)架构的大模型训练成为人工智能领域的重要研究方向。Qwen团队近期发布的Qwen2.5-Max模型,采用超过20万亿to...AIニュース4ヶ月前01.1K0
LLM蒸留:ビッグモデルの独立をめぐる「暗闘」?一、背景与挑战 随着人工智能技术的飞速发展,大型语言模型(LLM)已成为自然语言处理领域的核心驱动力。然而,训练这些模型需要巨大的计算资源和时间成本,这促使了 知识蒸馏(KD)技术的兴起。知识蒸馏通过...AIニュース4ヶ月前07490
新年の贈り物:COZEゼロベース・デザイン・オートメーション・ワークフロー・コース(799円相当)を無料進呈 全部可课程包含: 基础入门+自动化工作流实战课30节 基础课-Coze零基础开发Agent智能体-54节 https://pan.quark.cn/s/931e5e153f4d#/list/s...AIニュース4ヶ月前06500
ディープシーク、「大規模な悪意ある攻撃」を理由に新規登録を一時制限DeepSeek 遭遇大规模恶意攻击,暂时限制了新的注册,原因是其线上服务受到攻击,导致注册过程繁忙。此问题约2025年1月27日由 deepseek api 报错开始爆发,期间注册也出现小规模问题...AIニュース4ヶ月前08890
Qwen2.5-VLリリース: 長時間のビデオ理解、ビジュアルローカリゼーション、構造化出力、オープンソースによる微調整をサポート1.模型介绍 自 Qwen2-VL 发布以来的五个月里,众多开发者在 Qwen2-VL 视觉语言模型上构建了新模型,为Qwen团队提供了宝贵的反馈。在此期间,Qwen团队专注于构建更有用的视觉语言模型...AIニュース4ヶ月前01.3K0
ディープシーク、統合マルチモーダル理解と生成モデルをリリース:JanusFlowからJanus-ProへJanusFlow 速读 DeepSeek 团队又发新模型,28日凌晨推出了创新型多模态框架 Janus-Pro,这是一个能同时处理多模态理解和生成任务的统一模型。该模型基于 DeepSeek-LLM...AIニュース4ヶ月前09700
百川インテリジェンス、百川-Omni-1.5全方位大型モデルを発表、いくつかの測定でGPT-4o Miniを上回る临近年终,国内大模型领域再传喜讯。百川智能近期密集发布多款大模型产品,继全场景深度推理模型Baichuan-M1-preview和医疗增强开源模型Baichuan-M1-14B之后,又重磅推出了全模态...AIニュース4ヶ月前07130
DeepSeek:中国のオープンソースAIハリケーンがシリコンバレーを席巻、世界のAI事情を再構築する今日,中国AI领域冉冉升起的新星 DeepSeek,以其惊人的速度和实力,在全球范围内引发了一场科技界的“地震”。这款被誉为“国产AI之光”的应用,不仅在美区App Store免费榜上力压 ChatG...AIニュース4ヶ月前09270
徹底分析丨ケーススタディで見る次の3000億ドルエージェント市場2024年末,YC 合伙人 Jared 预测未来几年,垂直领域 AI Agent 将是比 SaaS 大10倍的新兴市场,这个领域还可能催生市值超过3000亿美元的科技巨头。届时,微软 CEO Saty...AIニュース4ヶ月前07150
大型モデルで理解できる動画の長さは?スマートスペクトラムGLM-4V-Plus:2時間在前两代视频模型(CogVLM2-Video和GLM-4V-PLUS)的基础上,我们进一步优化了视频理解技术,推出了GLM-4V-Plus-0111 beta版本。该版本引入了原生可变分辨率等技术,提...AIニュース4ヶ月前07540
Qwen2.5-1M: 100万トークンコンテキストをサポートするオープンソースQwenモデル1.引言 两个月前,Qwen团队升级了 Qwen2.5-Turbo,使其支持最多一百万个Tokens的上下文长度。今天,Qwen正式推出开源的 Qwen2.5-1M 模型及其对应的推理框架支持。以下是...AIニュース4ヶ月前09920
有言実行-o1推論モデル公開!コンシューマー向けグラフィックスカードで展開可能な初の出力ステップ解説2025开年,AI行业掀起大模型“推理潮”,自OpenAI发布o1后,各式推理模型不断涌现,模型的高阶推理能力迎来爆发增强,其应用价值也愈发获得业界的广泛关注。 近日,网易有道正式推出国内首个输出分步...AIニュース4ヶ月前06760