CARGA

Sharenet
  • Tutoriales prácticos sobre IA
  • Comandos de utilidad de AI
  • Información sobre el curso
  • Base de conocimientos de IA
  • AI Respuestas
  • Quiero contribuir
    • Principales recomendaciones sobre IA
    • Últimas herramientas de IA
    • AI Redacción de artículos
    • Generación de imágenes AI
    • Herramientas de vídeo AI
    • AI Eficiencia en la oficina
    • Herramientas de programación de IA
    • Herramientas de diseño de IA
    • Asistente de chat
    • Inteligencia Artificial

    大模型微调

    共 28 篇文章
    ordenar
    Correo electrónico:actualizaciónhojearfelicitaciones
    OpenManus-RL:微调大模型强化智能体推理与决策能力

    OpenManus-RL:微调大模型强化智能体推理与决策能力

    综合介绍 OpenManus-RL是由UIUC-Ulab与 MetaGPT 社区的OpenManus团队联合开发的开源项目,托管于GitHub。该项目通过强化学习(RL)技术提升大型语言模型(LLM...
    Últimas herramientas de IA# AI Java Proyecto de código abierto# Ajuste del modelo grande
    hace 3 meses
    05350
    MM-EUREKA:探索视觉推理的多模态强化学习工具

    MM-EUREKA:探索视觉推理的多模态强化学习工具

    综合介绍 MM-EUREKA 是一个由上海人工智能实验室、上海交通大学等多方合作开发的开源项目。它通过基于规则的强化学习技术,把文本推理能力扩展到多模态场景,帮助模型处理图像和文字信息。这个工具的核心...
    Últimas herramientas de IA# AI Java Proyecto de código abierto# Ajuste del modelo grande
    hace 3 meses
    04910
    Search-R1:强化学习训练大模型搜索与推理的工具

    Search-R1:强化学习训练大模型搜索与推理的工具

    综合介绍 Search-R1 是一个开源项目,由 PeterGriffinJin 在 GitHub 上开发,基于 veRL 框架构建。它通过强化学习(RL)技术训练大语言模型(LLM),让模型自主学会...
    Últimas herramientas de IA# AI Java Proyecto de código abierto# Ajuste del modelo grande
    hace 2 meses
    04880
    Bonsai:适合边缘设备运行的三值权重语言模型

    Bonsai:适合边缘设备运行的三值权重语言模型

    综合介绍 Bonsai 是 deepgrove-ai 开发的一个开源语言模型,参数规模为 5 亿,采用三值权重(ternary weights)技术。它基于 Llama 架构和 Mistral 分词器...
    Últimas herramientas de IA# AI Java Proyecto de código abierto# Ajuste del modelo grande
    hace 2 meses
    04840
    X-R1:在普通设备中低成本训练0.5B模型

    X-R1:在普通设备中低成本训练0.5B模型

    综合介绍 X-R1 是一个由 dhcode-cpp 团队在 GitHub 上开源的强化学习框架,旨在为开发者提供一个低成本、高效的工具,用于训练基于端到端强化学习的模型。该项目受到 DeepSeek...
    Últimas herramientas de IA# AI Java Proyecto de código abierto# Ajuste del modelo grande
    hace 3 meses
    03890
    WeClone:用微信聊天记录和语音训练数字分身

    WeClone: formación de dobles digitales con registros de chat y voces de WeChat

    综合介绍 WeClone 是一个开源项目,它通过微信聊天记录和语音消息,结合大语言模型和语音合成技术,让用户创建个性化的数字分身。项目能分析用户的聊天习惯来训练模型,还可以用少量语音样本生成逼真的声音...
    Últimas herramientas de IA# AI Java Proyecto de código abierto# Ajuste del modelo grande
    hace 2 meses
    03700
    DeepCoder-14B-Preview:擅长代码生成的的开源模型

    DeepCoder-14B-Preview:擅长代码生成的的开源模型

    综合介绍 DeepCoder-14B-Preview 是由 Agentica 团队开发并在 Hugging Face 平台发布的开源代码生成模型。它基于 DeepSeek-R1-Distilled-Q...
    Últimas herramientas de IA# AI Java Proyecto de código abierto# Ajuste del modelo grande
    hace 2 meses
    03350
    MiniMind-V:1小时训练26M参数视觉语言模型

    MiniMind-V:1小时训练26M参数视觉语言模型

    综合介绍 MiniMind-V 是一个开源项目,托管于 GitHub,旨在帮助用户在 1 小时内训练一个仅 2600 万参数的轻量级视觉语言模型(VLM)。它基于 MiniMind 语言模型,新增视觉...
    Últimas herramientas de IA# AI Java Proyecto de código abierto# Ajuste del modelo grande
    hace 2 meses
    02580
    GraphGen:利用知识图谱生成合成数据微调语言模型

    GraphGen:利用知识图谱生成合成数据微调语言模型

    综合介绍 GraphGen 是一个由上海人工智能实验室 OpenScienceLab 开发的开源框架,托管于 GitHub,专注于通过知识图谱指导合成数据生成,优化大语言模型(LLM)的监督微调。它从...
    Últimas herramientas de IA# AI Java Proyecto de código abierto# Ajuste del modelo grande# Gráfico del conocimiento
    1个月前
    02240
    No es eso.
    Sharenet
    Sharenet.ai, la mejor y más completa guía de aprendizaje de IA y la navegación de herramientas. Abrazar la ola AI juntos! Ctrl + D o ⌘ + D Marcar este sitio a la barra de marcadores del navegador ❤️

    Aplicación Friendly Linkdeclaración negando o limitando la responsabilidadCooperación publicitariaQuiénes somos

    Derechos de autor © 2025 Sharenet 
    es_ESEspañol
    es_ESEspañolzh_CN简体中文 en_USEnglish ja日本語 ko_KR한국어 de_DEDeutsch fr_FRFrançais pt_BRPortuguês do Brasil
    escritos
    escritosdirección webhardwareLibro