DeepSeek: questões ignoradas pela mídia特邀撰稿人 Lennart Heim 和 Sihao Huang,本文交叉发布于 Lennart 的个人博客。Lennart 是 ChinaTalk 的常客,最近曾参与关于测试时计算时代的地缘政治的讨...Notícias sobre IA4 meses atrás07190
A Mistral lança o Mistral Small 3 de código aberto: o desempenho rivaliza com o GPT-4o e supera o Llama 3Mistral Small 3:Apache 2.0 协议,81% MMLU,150 tokens/秒 今天,Mistral AI 推出 Mistral Small 3,这是一款延迟优化的 240 亿...Notícias sobre IA4 meses atrás05950
O analista Alberto Romero especula: na verdade, o GPT-5 da OpenAI já deveria ter sido lançado há muito tempo让我们以激动人心的方式开启新的一年 可能由 GPT-5 生成 如果我告诉你 GPT-5 是真实存在的。不仅是真实的,而且已经在你看不见的地方塑造世界。这里有个假设:OpenAI 已经开发了 GPT...Notícias sobre IA4 meses atrás07660
Os produtos para PC Microsoft Azure+Copilot+AI suportam totalmente os modelos DeepSeek R12025 年 1 月 30 日,微软表示,DeepSeek 的 R1 模型已在其 Azure 云计算平台和面向广大开发人员的 GitHub 工具上可供使用。微软还表示,客户很快就可以在他们的 Copi...Notícias sobre IA4 meses atrás08170
CEO da Anthropic apoia a hegemonia da IA dos EUA, chamando a atenção para a "ameaça da China点评: 1. 抹黑中国AI发展,渲染“中国威胁论” 文章作者站在美国立场,刻意渲染 DeepSeek 等中国AI企业的技术进步对美国的所谓“威胁”,并将其与所谓的“XXX威胁”强行关联,这种论调充斥着...Notícias sobre IA4 meses atrás07010
Harvard lança um guia para aplicativos de IA generativa para estudantes com quatro recomendações e 33 estratégias2025年1月17日,哈佛大学教育研究生院(Harvard Graduate School of Education)发布《学生自主项目中的GenAI:建议和启示》指南,该指南由哈佛创意计算实验室(C...Notícias sobre IA4 meses atrás07790
Replicando o DeepSeek-R1: 8 mil exemplos matemáticos ajudam modelos pequenos a obter avanços na inferência por meio do aprendizado por reforçoGithub: https://github.com/hkust-nlp/simpleRL-reason 这篇博客将展示一个对DeepSeek-R1-Zero 和 DeepSeek-R1训练的复现...Notícias sobre IA4 meses atrás09270
Qwen2.5-Max baseado na arquitetura MoE supera completamente o desempenho do DeepSeek V3模型概览 近年来,基于混合专家系统(Mixture of Experts,MoE)架构的大模型训练成为人工智能领域的重要研究方向。Qwen团队近期发布的Qwen2.5-Max模型,采用超过20万亿to...Notícias sobre IA4 meses atrás01.1K0
Destilação do LLM: uma "guerra negra" contra a independência dos grandes modelos?一、背景与挑战 随着人工智能技术的飞速发展,大型语言模型(LLM)已成为自然语言处理领域的核心驱动力。然而,训练这些模型需要巨大的计算资源和时间成本,这促使了 知识蒸馏(KD)技术的兴起。知识蒸馏通过...Notícias sobre IA4 meses atrás07490
Presente de Ano Novo: Curso gratuito de fluxo de trabalho de automação de projeto zero-básico COZE no valor de 799 全部可课程包含: 基础入门+自动化工作流实战课30节 基础课-Coze零基础开发Agent智能体-54节 https://pan.quark.cn/s/931e5e153f4d#/list/s...Notícias sobre IA4 meses atrás06500
DeepSeek limita temporariamente novos registros, citando "ataques maliciosos maciços"DeepSeek 遭遇大规模恶意攻击,暂时限制了新的注册,原因是其线上服务受到攻击,导致注册过程繁忙。此问题约2025年1月27日由 deepseek api 报错开始爆发,期间注册也出现小规模问题...Notícias sobre IA4 meses atrás08890
Qwen2.5-VL lançado: suporta compreensão de vídeos longos, localização visual, saída estruturada, código aberto ajustável1.模型介绍 自 Qwen2-VL 发布以来的五个月里,众多开发者在 Qwen2-VL 视觉语言模型上构建了新模型,为Qwen团队提供了宝贵的反馈。在此期间,Qwen团队专注于构建更有用的视觉语言模型...Notícias sobre IA4 meses atrás01.3K0
DeepSeek lança compreensão multimodal unificada e modelos generativos: do JanusFlow ao Janus-ProJanusFlow 速读 DeepSeek 团队又发新模型,28日凌晨推出了创新型多模态框架 Janus-Pro,这是一个能同时处理多模态理解和生成任务的统一模型。该模型基于 DeepSeek-LLM...Notícias sobre IA4 meses atrás09700
A Baichuan Intelligence lança o modelo grande omnimodal Baichuan-Omni-1.5, que supera o GPT-4o Mini em várias medições临近年终,国内大模型领域再传喜讯。百川智能近期密集发布多款大模型产品,继全场景深度推理模型Baichuan-M1-preview和医疗增强开源模型Baichuan-M1-14B之后,又重磅推出了全模态...Notícias sobre IA4 meses atrás07130
DeepSeek: o furacão de IA de código aberto da China varre o Vale do Silício, remodelando o cenário global de IA今日,中国AI领域冉冉升起的新星 DeepSeek,以其惊人的速度和实力,在全球范围内引发了一场科技界的“地震”。这款被誉为“国产AI之光”的应用,不仅在美区App Store免费榜上力压 ChatG...Notícias sobre IA4 meses atrás09270
Análise aprofundada - O próximo mercado de agentes de US$ 300 bilhões, com estudos de caso2024年末,YC 合伙人 Jared 预测未来几年,垂直领域 AI Agent 将是比 SaaS 大10倍的新兴市场,这个领域还可能催生市值超过3000亿美元的科技巨头。届时,微软 CEO Saty...Notícias sobre IA4 meses atrás07160
Por quanto tempo um modelo grande consegue entender um vídeo? Smart Spectrum GLM-4V-Plus: 2 horas在前两代视频模型(CogVLM2-Video和GLM-4V-PLUS)的基础上,我们进一步优化了视频理解技术,推出了GLM-4V-Plus-0111 beta版本。该版本引入了原生可变分辨率等技术,提...Notícias sobre IA4 meses atrás07540
Qwen2.5-1M: um modelo Qwen de código aberto com suporte para 1 milhão de contextos de tokens1.引言 两个月前,Qwen团队升级了 Qwen2.5-Turbo,使其支持最多一百万个Tokens的上下文长度。今天,Qwen正式推出开源的 Qwen2.5-1M 模型及其对应的推理框架支持。以下是...Notícias sobre IA4 meses atrás09920
Lançamento do modelo de inferência Arigatou Ziyou-o1! Primeira explicação passo a passo de saída que pode ser implementada em placas gráficas de nível de consumidor2025开年,AI行业掀起大模型“推理潮”,自OpenAI发布o1后,各式推理模型不断涌现,模型的高阶推理能力迎来爆发增强,其应用价值也愈发获得业界的广泛关注。 近日,网易有道正式推出国内首个输出分步...Notícias sobre IA4 meses atrás06760