Sharenet.ai

Dia arqueando um peão e compartilhando o rei!
CoRAG:利用MCTS(蒙特卡洛树)动态链式 RAG 模型

CoRAG: modelagem dinâmica de RAG encadeada usando MCTS (Monte Carlo Trees)

Resumo das principais contribuições do CORAG O CORAG (Cost-Constrained Retrieval Optimization for Retrieval-Augmented Generation) é um programa...
6 meses atrás
01.1K
Float:跨语言智能搜索引擎,用母语检索不同语言知识

Float: um mecanismo de busca inteligente entre idiomas para recuperar conhecimento em diferentes idiomas em sua língua materna

综合介绍 FloatSearch AI 是一款基于人工智能技术的跨语言智能搜索引擎,旨在为用户提供更精准、高效的搜索体验。它能够理解用户的自然语言查询,并根据语义分析提供相关且准确的答案。FloatS...
6 meses atrás
0929
一文说清楚 知识蒸馏 (Distillation):让“小模型”也能拥有“大智慧”

Um artigo claro sobre Destilação de Conhecimento (Destilação): permitir que o "modelo pequeno" também possa ter "grande sabedoria".

A destilação de conhecimento é uma técnica de aprendizado de máquina que visa transferir o aprendizado de um modelo grande pré-treinado (ou seja, um "modelo de professor") para um "modelo de aluno" menor. As técnicas de destilação podem nos ajudar a desenvolver modelos generativos mais leves para diálogo inteligente, criação de conteúdo e outras áreas. Recentemente ...
6 meses atrás
01.3K
Langui:开源的AI用户界面组件库

Langui: uma biblioteca de código aberto de componentes de interface de usuário de IA

综合介绍 LangbaseInc的Langui是一个开源的用户界面组件库,专为生成式AI和大语言模型(LLM)项目设计。该库基于Tailwind CSS,提供了一系列预构建的UI组件,帮助开发者快速构...
6 meses atrás
01K
Qwen2.5-VL 发布:支持长视频理解、视觉定位、结构化输出,开源可微调

Qwen2.5-VL lançado: suporta compreensão de vídeos longos, localização visual, saída estruturada, código aberto ajustável

1.模型介绍 自 Qwen2-VL 发布以来的五个月里,众多开发者在 Qwen2-VL 视觉语言模型上构建了新模型,为Qwen团队提供了宝贵的反馈。在此期间,Qwen团队专注于构建更有用的视觉语言模型...
6 meses atrás
01.5K
大模型参数量如何计算?7B、13B、65B 究竟代表什么?

Como calcular o número de parâmetros de um modelo grande e o que significam 7B, 13B e 65B?

Recentemente, muitas pessoas envolvidas no treinamento e na inferência de modelos grandes têm discutido a relação entre o número de parâmetros do modelo e o tamanho do modelo. Por exemplo, o famoso modelo grande LLaMA da série alpaca contém LLaMA-7B, LLaMA-13B, LLaMA-33B e LLaMA...
6 meses atrás
01.5K
DeepSeek发布统一多模态理解与生成模型:从 JanusFlow 到 Janus-Pro

DeepSeek lança compreensão multimodal unificada e modelos generativos: do JanusFlow ao Janus-Pro

JanusFlow 速读 DeepSeek 团队又发新模型,28日凌晨推出了创新型多模态框架 Janus-Pro,这是一个能同时处理多模态理解和生成任务的统一模型。该模型基于 DeepSeek-LLM...
5 meses atrás
01.1K
百川智能发布Baichuan-Omni-1.5全模态大模型,多项测评超越GPT-4o Mini

A Baichuan Intelligence lança o modelo grande omnimodal Baichuan-Omni-1.5, que supera o GPT-4o Mini em várias medições

临近年终,国内大模型领域再传喜讯。百川智能近期密集发布多款大模型产品,继全场景深度推理模型Baichuan-M1-preview和医疗增强开源模型Baichuan-M1-14B之后,又重磅推出了全模态...
6 meses atrás
0835
Your Daily Minute:通过AI视频日记提升情绪认知和自我反思

Your Daily Minute: Melhorando a consciência emocional e a autorreflexão por meio de um diário em vídeo com IA

Descrição geral O Your Daily Minute é um aplicativo inovador de diário em vídeo que usa tecnologia de IA para ajudar os usuários a registrar e entender as emoções diárias. Os usuários podem gravar um vídeo de reflexão de um minuto por dia, e o aplicativo transcreve e analisa automaticamente o conteúdo emocional para fornecer uma visão instantânea do estado emocional. O ...
6 meses atrás
0892
Taskek:AI驱动的团队协作和项目管理工具

Taskek: ferramenta de colaboração em equipe e gerenciamento de projetos com tecnologia de IA

综合介绍 Taskek是一款集成了Trello、Google Docs和Miro功能的AI驱动的生产力工具,适用于从高层建筑到家庭办公室的各类工作环境。它允许团队从简单绘图开始,迅速转化为具体任务,提...
4 meses atrás
0909