AI新闻 - 第13页

Informações sobre o curso Comandos do utilitário de IA Ferramentas de IA mais recentes Base de conhecimento de IA Notícias sobre IA Tutoriais práticos de IA Respostas da IA

organizar em ordem

postagem atualização passar por cima elogios

DeepSeek: questões ignoradas pela mídia

特邀撰稿人 Lennart Heim 和 Sihao Huang，本文交叉发布于 Lennart 的个人博客。Lennart 是 ChinaTalk 的常客，最近曾参与关于测试时计算时代的地缘政治的讨...

Notícias sobre IA

4 meses atrás

07190

Mistral 发布开源 Mistral Small 3：性能媲美 GPT-4o，速度超越 Llama 3

A Mistral lança o Mistral Small 3 de código aberto: o desempenho rivaliza com o GPT-4o e supera o Llama 3

Mistral Small 3：Apache 2.0 协议，81% MMLU，150 tokens/秒今天，Mistral AI 推出 Mistral Small 3，这是一款延迟优化的 240 亿...

Notícias sobre IA

4 meses atrás

05950

O analista Alberto Romero especula: na verdade, o GPT-5 da OpenAI já deveria ter sido lançado há muito tempo

让我们以激动人心的方式开启新的一年可能由 GPT-5 生成如果我告诉你 GPT-5 是真实存在的。不仅是真实的，而且已经在你看不见的地方塑造世界。这里有个假设：OpenAI 已经开发了 GPT...

Notícias sobre IA

4 meses atrás

07660

微软 Azure+Copilot+AI PC 产品全线支持 DeepSeek R1 模型

Os produtos para PC Microsoft Azure+Copilot+AI suportam totalmente os modelos DeepSeek R1

2025 年 1 月 30 日，微软表示，DeepSeek 的 R1 模型已在其 Azure 云计算平台和面向广大开发人员的 GitHub 工具上可供使用。微软还表示，客户很快就可以在他们的 Copi...

Notícias sobre IA

4 meses atrás

08170

CEO da Anthropic apoia a hegemonia da IA dos EUA, chamando a atenção para a "ameaça da China

点评： 1. 抹黑中国AI发展，渲染“中国威胁论” 文章作者站在美国立场，刻意渲染 DeepSeek 等中国AI企业的技术进步对美国的所谓“威胁”，并将其与所谓的“XXX威胁”强行关联，这种论调充斥着...

Notícias sobre IA

4 meses atrás

07010

Harvard lança um guia para aplicativos de IA generativa para estudantes com quatro recomendações e 33 estratégias

2025年1月17日，哈佛大学教育研究生院（Harvard Graduate School of Education）发布《学生自主项目中的GenAI：建议和启示》指南，该指南由哈佛创意计算实验室（C...

Notícias sobre IA

4 meses atrás

07790

Replicando o DeepSeek-R1: 8 mil exemplos matemáticos ajudam modelos pequenos a obter avanços na inferência por meio do aprendizado por reforço

Github: https://github.com/hkust-nlp/simpleRL-reason 这篇博客将展示一个对DeepSeek-R1-Zero 和 DeepSeek-R1训练的复现...

Notícias sobre IA

4 meses atrás

09270

Qwen2.5-Max baseado na arquitetura MoE supera completamente o desempenho do DeepSeek V3

模型概览近年来，基于混合专家系统（Mixture of Experts，MoE）架构的大模型训练成为人工智能领域的重要研究方向。Qwen团队近期发布的Qwen2.5-Max模型，采用超过20万亿to...

Notícias sobre IA

4 meses atrás

01.1K0

Destilação do LLM: uma "guerra negra" contra a independência dos grandes modelos?

一、背景与挑战随着人工智能技术的飞速发展，大型语言模型（LLM）已成为自然语言处理领域的核心驱动力。然而，训练这些模型需要巨大的计算资源和时间成本，这促使了知识蒸馏（KD）技术的兴起。知识蒸馏通过...

Notícias sobre IA

4 meses atrás

07490

Presente de Ano Novo: Curso gratuito de fluxo de trabalho de automação de projeto zero-básico COZE no valor de 799

全部可课程包含：基础入门+自动化工作流实战课30节基础课-Coze零基础开发Agent智能体-54节 https://pan.quark.cn/s/931e5e153f4d#/list/s...

Notícias sobre IA

4 meses atrás

06500

DeepSeek limita temporariamente novos registros, citando "ataques maliciosos maciços"

DeepSeek 遭遇大规模恶意攻击，暂时限制了新的注册，原因是其线上服务受到攻击，导致注册过程繁忙。此问题约2025年1月27日由 deepseek api 报错开始爆发，期间注册也出现小规模问题...

Notícias sobre IA

4 meses atrás

08890

Qwen2.5-VL lançado: suporta compreensão de vídeos longos, localização visual, saída estruturada, código aberto ajustável

1.模型介绍自 Qwen2-VL 发布以来的五个月里，众多开发者在 Qwen2-VL 视觉语言模型上构建了新模型，为Qwen团队提供了宝贵的反馈。在此期间，Qwen团队专注于构建更有用的视觉语言模型...

Notícias sobre IA

4 meses atrás

01.3K0

DeepSeek发布统一多模态理解与生成模型：从 JanusFlow 到 Janus-Pro

DeepSeek lança compreensão multimodal unificada e modelos generativos: do JanusFlow ao Janus-Pro

JanusFlow 速读 DeepSeek 团队又发新模型，28日凌晨推出了创新型多模态框架 Janus-Pro，这是一个能同时处理多模态理解和生成任务的统一模型。该模型基于 DeepSeek-LLM...

Notícias sobre IA

4 meses atrás

09700

百川智能发布Baichuan-Omni-1.5全模态大模型，多项测评超越GPT-4o Mini

A Baichuan Intelligence lança o modelo grande omnimodal Baichuan-Omni-1.5, que supera o GPT-4o Mini em várias medições

临近年终，国内大模型领域再传喜讯。百川智能近期密集发布多款大模型产品，继全场景深度推理模型Baichuan-M1-preview和医疗增强开源模型Baichuan-M1-14B之后，又重磅推出了全模态...

Notícias sobre IA

4 meses atrás

07130

DeepSeek: o furacão de IA de código aberto da China varre o Vale do Silício, remodelando o cenário global de IA

今日，中国AI领域冉冉升起的新星 DeepSeek，以其惊人的速度和实力，在全球范围内引发了一场科技界的“地震”。这款被誉为“国产AI之光”的应用，不仅在美区App Store免费榜上力压 ChatG...

Notícias sobre IA

4 meses atrás

09270

Análise aprofundada - O próximo mercado de agentes de US$ 300 bilhões, com estudos de caso

2024年末，YC 合伙人 Jared 预测未来几年，垂直领域 AI Agent 将是比 SaaS 大10倍的新兴市场，这个领域还可能催生市值超过3000亿美元的科技巨头。届时，微软 CEO Saty...

Notícias sobre IA

4 meses atrás

07160

Por quanto tempo um modelo grande consegue entender um vídeo? Smart Spectrum GLM-4V-Plus: 2 horas

在前两代视频模型（CogVLM2-Video和GLM-4V-PLUS）的基础上，我们进一步优化了视频理解技术，推出了GLM-4V-Plus-0111 beta版本。该版本引入了原生可变分辨率等技术，提...

Notícias sobre IA

4 meses atrás

07540

Qwen2.5-1M: um modelo Qwen de código aberto com suporte para 1 milhão de contextos de tokens

1.引言两个月前，Qwen团队升级了 Qwen2.5-Turbo，使其支持最多一百万个Tokens的上下文长度。今天，Qwen正式推出开源的 Qwen2.5-1M 模型及其对应的推理框架支持。以下是...

Notícias sobre IA

4 meses atrás

09920

Lançamento do modelo de inferência Arigatou Ziyou-o1! Primeira explicação passo a passo de saída que pode ser implementada em placas gráficas de nível de consumidor

2025开年，AI行业掀起大模型“推理潮”，自OpenAI发布o1后，各式推理模型不断涌现，模型的高阶推理能力迎来爆发增强，其应用价值也愈发获得业界的广泛关注。近日，网易有道正式推出国内首个输出分步...

Notícias sobre IA

4 meses atrás

06760

Carregar mais