大模型微调 - 第2页

organizar em ordem

postagem atualização passar por cima elogios

OpenManus-RL: ajuste fino de modelos grandes para aprimorar o raciocínio e a tomada de decisões de corpos inteligentes

综合介绍 OpenManus-RL是由UIUC-Ulab与 MetaGPT 社区的OpenManus团队联合开发的开源项目，托管于GitHub。该项目通过强化学习（RL）技术提升大型语言模型（LLM...

Ferramentas de IA mais recentes # Projeto de código aberto AI Java # Ajuste fino do modelo grande

3 meses atrás

05340

MM-EUREKA: uma ferramenta de aprendizagem por reforço multimodal para explorar o raciocínio visual

综合介绍 MM-EUREKA 是一个由上海人工智能实验室、上海交通大学等多方合作开发的开源项目。它通过基于规则的强化学习技术，把文本推理能力扩展到多模态场景，帮助模型处理图像和文字信息。这个工具的核心...

Ferramentas de IA mais recentes # Projeto de código aberto AI Java # Ajuste fino do modelo grande

3 meses atrás

04840

Search-R1: Aprendizado por reforço para treinar modelos grandes para pesquisa e raciocínio

综合介绍 Search-R1 是一个开源项目，由 PeterGriffinJin 在 GitHub 上开发，基于 veRL 框架构建。它通过强化学习（RL）技术训练大语言模型（LLM），让模型自主学会...

Ferramentas de IA mais recentes # Projeto de código aberto AI Java # Ajuste fino do modelo grande

2 meses atrás

04800

Bonsai: um modelo de linguagem ponderada de três valores adequado para operação em dispositivos de borda

综合介绍 Bonsai 是 deepgrove-ai 开发的一个开源语言模型，参数规模为 5 亿，采用三值权重（ternary weights）技术。它基于 Llama 架构和 Mistral 分词器...

Ferramentas de IA mais recentes # Projeto de código aberto AI Java # Ajuste fino do modelo grande

2 meses atrás

04790

X-R1: Treinamento de baixo custo de modelos de 0,5B em dispositivos comuns

综合介绍 X-R1 是一个由 dhcode-cpp 团队在 GitHub 上开源的强化学习框架，旨在为开发者提供一个低成本、高效的工具，用于训练基于端到端强化学习的模型。该项目受到 DeepSeek...

Ferramentas de IA mais recentes # Projeto de código aberto AI Java # Ajuste fino do modelo grande

3 meses atrás

03880

WeClone: treinamento de doppelgangers digitais com registros de bate-papo e vozes do WeChat

综合介绍 WeClone 是一个开源项目，它通过微信聊天记录和语音消息，结合大语言模型和语音合成技术，让用户创建个性化的数字分身。项目能分析用户的聊天习惯来训练模型，还可以用少量语音样本生成逼真的声音...

Ferramentas de IA mais recentes # Projeto de código aberto AI Java # Ajuste fino do modelo grande

2 meses atrás

03690

DeepCoder-14B-Preview: um modelo de código aberto que se destaca na geração de código

综合介绍 DeepCoder-14B-Preview 是由 Agentica 团队开发并在 Hugging Face 平台发布的开源代码生成模型。它基于 DeepSeek-R1-Distilled-Q...

Ferramentas de IA mais recentes # Projeto de código aberto AI Java # Ajuste fino do modelo grande

2 meses atrás

03330

MiniMind-V: treinamento de 1 hora de um modelo de linguagem visual com 26 milhões de parâmetros

综合介绍 MiniMind-V 是一个开源项目，托管于 GitHub，旨在帮助用户在 1 小时内训练一个仅 2600 万参数的轻量级视觉语言模型（VLM）。它基于 MiniMind 语言模型，新增视觉...

Ferramentas de IA mais recentes # Projeto de código aberto AI Java # Ajuste fino do modelo grande

2 meses atrás

02570

GraphGen: ajuste fino de modelos de linguagem usando gráficos de conhecimento para gerar dados sintéticos

综合介绍 GraphGen 是一个由上海人工智能实验室 OpenScienceLab 开发的开源框架，托管于 GitHub，专注于通过知识图谱指导合成数据生成，优化大语言模型（LLM）的监督微调。它从...

Ferramentas de IA mais recentes # Projeto de código aberto AI Java # Ajuste fino do modelo grande # Gráfico de conhecimento

4 semanas atrás

02240

Não é isso.

Ajuste fino de modelos grandes