Documento da Microsoft que vazou: apenas 8 bilhões para o GPT-4o-mini e 100 bilhões para o o1-mini?

Notícias sobre IAPublicado há 5 meses Sharenet.ai

778 0

Tem havido uma discussão contínua sobre os tamanhos dos parâmetros dos principais LLMs de código fechado e, nos últimos dois dias de 2024, um artigo da Microsoft sobre oDetecção e correção de erros médicos em anotações clínicasconjecturaexperimentopadrão de referênciaO estudo MEDEC ignorou acidentalmente e diretamente a escala de seus parâmetros:o1-preview, GPT-4.GPT-4o eClaude 3.5 Soneto.

Endereço para correspondência: https://arxiv.org/pdf/2412.19260v1

A parte experimental do experimento também divide as grandes escalas de parâmetros do modelo em três blocos:7-8B, ~100-300B, ~1,7Tmas (não)GPT-4o-miniSer colocado na primeira posição com apenas 8B é um pouco inacreditável.

resumos

Claude 3,5 Soneto (2024-10-22), ~175B
ChatGPT, ~175B
GPT-4, aproximadamente 1,76T
GPT-4o, ~200B
GPT-4o-mini (gpt-4o-2024-05-13) somente 8B
Último o1-mini (o1-mini-2024-09-12) apenas 100B
o1-preview (o1-preview-2024-09-12) ~ 300B

Notícias sobre IA

O artigo é protegido por direitos autorais e não deve ser reproduzido sem permissão.

Modelo Microsoft Magma: um corpo inteligente de IA que cuida das operações da interface do usuário e dos controles do robô

Notícias sobre IA

3 meses atrás

05350

Experiência aberta do Smart Spectrum GLM-PC: agente multimodal para operação autônoma do computador atualizado

Notícias sobre IA

4 meses atrás

01K0

Devv Builder: gere rapidamente código de back-end, seu acelerador de desenvolvimento de pilha completa está chegando!

Notícias sobre IA

5 meses atrás

08720

Amazon Nova系列基础模型：提供全面的生成式人工智能（Gen AI）服务

Família de modelos básicos da Amazon Nova: fornecendo serviços abrangentes de inteligência artificial generativa (Gen AI)

Notícias sobre IA

6 meses atrás

08700

Sem comentários

Nenhum comentário...

Documento da Microsoft que vazou: apenas 8 bilhões para o GPT-4o-mini e 100 bilhões para o o1-mini?

Copilot no OneDrive 2025 Rota de novos recursos

Xinference: implantação e veiculação fáceis de modelos de IA distribuídos

Artigos relacionados

Modelo Microsoft Magma: um corpo inteligente de IA que cuida das operações da interface do usuário e dos controles do robô

Experiência aberta do Smart Spectrum GLM-PC: agente multimodal para operação autônoma do computador atualizado

Devv Builder: gere rapidamente código de back-end, seu acelerador de desenvolvimento de pilha completa está chegando!

Família de modelos básicos da Amazon Nova: fornecendo serviços abrangentes de inteligência artificial generativa (Gen AI)

Sem comentários

Artigos mais recentes

Documento da Microsoft que vazou: apenas 8 bilhões para o GPT-4o-mini e 100 bilhões para o o1-mini?

Copilot no OneDrive 2025 Rota de novos recursos

Xinference: implantação e veiculação fáceis de modelos de IA distribuídos

Artigos relacionados

Modelo Microsoft Magma: um corpo inteligente de IA que cuida das operações da interface do usuário e dos controles do robô

Experiência aberta do Smart Spectrum GLM-PC: agente multimodal para operação autônoma do computador atualizado

Devv Builder: gere rapidamente código de back-end, seu acelerador de desenvolvimento de pilha completa está chegando!

Família de modelos básicos da Amazon Nova: fornecendo serviços abrangentes de inteligência artificial generativa (Gen AI)

Sem comentários

Ferramentas de IA selecionadas

Artigos mais recentes