Sharenet.ai

日拱一卒,分享为王!
CoRAG:利用MCTS(蒙特卡洛树)动态链式 RAG 模型

CoRAG:利用MCTS(蒙特卡洛树)动态链式 RAG 模型

CORAG 的主要贡献总结 CORAG(Cost-Constrained Retrieval Optimization for Retrieval-Augmented Generation)是一种...
6个月前
01.1K
Float:跨语言智能搜索引擎,用母语检索不同语言知识

Float:跨语言智能搜索引擎,用母语检索不同语言知识

综合介绍 FloatSearch AI 是一款基于人工智能技术的跨语言智能搜索引擎,旨在为用户提供更精准、高效的搜索体验。它能够理解用户的自然语言查询,并根据语义分析提供相关且准确的答案。FloatS...
6个月前
0931
一文说清楚 知识蒸馏 (Distillation):让“小模型”也能拥有“大智慧”

一文说清楚 知识蒸馏 (Distillation):让“小模型”也能拥有“大智慧”

知识蒸馏是一种机器学习技术,目的是将预先训练好的大型模型(即 "教师模型")的学习成果转移到较小的 "学生模型 "中。蒸馏技术可以帮助我们开发更轻量化的生成模型,用于智能对话、内容创作等领域。 最近 ...
6个月前
01.3K
Langui:开源的AI用户界面组件库

Langui:开源的AI用户界面组件库

综合介绍 LangbaseInc的Langui是一个开源的用户界面组件库,专为生成式AI和大语言模型(LLM)项目设计。该库基于Tailwind CSS,提供了一系列预构建的UI组件,帮助开发者快速构...
6个月前
01K
Qwen2.5-VL 发布:支持长视频理解、视觉定位、结构化输出,开源可微调

Qwen2.5-VL 发布:支持长视频理解、视觉定位、结构化输出,开源可微调

1.模型介绍 自 Qwen2-VL 发布以来的五个月里,众多开发者在 Qwen2-VL 视觉语言模型上构建了新模型,为Qwen团队提供了宝贵的反馈。在此期间,Qwen团队专注于构建更有用的视觉语言模型...
6个月前
01.5K
大模型参数量如何计算?7B、13B、65B 究竟代表什么?

大模型参数量如何计算?7B、13B、65B 究竟代表什么?

最近,许多从事大模型训练和推理的朋友都在讨论模型参数量和模型大小之间的关系。例如,著名的羊驼系列 LLaMA 大模型,就包含了 LLaMA-7B、LLaMA-13B、LLaMA-33B 和 LLaMA...
6个月前
01.5K
DeepSeek发布统一多模态理解与生成模型:从 JanusFlow 到 Janus-Pro

DeepSeek发布统一多模态理解与生成模型:从 JanusFlow 到 Janus-Pro

JanusFlow 速读 DeepSeek 团队又发新模型,28日凌晨推出了创新型多模态框架 Janus-Pro,这是一个能同时处理多模态理解和生成任务的统一模型。该模型基于 DeepSeek-LLM...
5个月前
01.1K
百川智能发布Baichuan-Omni-1.5全模态大模型,多项测评超越GPT-4o Mini

百川智能发布Baichuan-Omni-1.5全模态大模型,多项测评超越GPT-4o Mini

临近年终,国内大模型领域再传喜讯。百川智能近期密集发布多款大模型产品,继全场景深度推理模型Baichuan-M1-preview和医疗增强开源模型Baichuan-M1-14B之后,又重磅推出了全模态...
6个月前
0835
Your Daily Minute:通过AI视频日记提升情绪认知和自我反思

Your Daily Minute:通过AI视频日记提升情绪认知和自我反思

综合介绍 Your Daily Minute是一款创新的视频日记应用,通过AI技术帮助用户记录和理解每日情绪。用户可以每天录制一分钟的视频反思,应用会自动转录并分析情绪内容,提供即时的情绪状态洞察。该...
6个月前
0892
Taskek:AI驱动的团队协作和项目管理工具

Taskek:AI驱动的团队协作和项目管理工具

综合介绍 Taskek是一款集成了Trello、Google Docs和Miro功能的AI驱动的生产力工具,适用于从高层建筑到家庭办公室的各类工作环境。它允许团队从简单绘图开始,迅速转化为具体任务,提...
4个月前
0909