Sharenet.ai

Day arching a pawn and sharing for the king!
CoRAG:利用MCTS(蒙特卡洛树)动态链式 RAG 模型

CoRAG: Dynamic chained RAG modeling using MCTS (Monte Carlo Trees)

CORAG 的主要贡献总结 CORAG(Cost-Constrained Retrieval Optimization for Retrieval-Augmented Generation)是一种...
6mos ago
01.1K
Float:跨语言智能搜索引擎,用母语检索不同语言知识

Float: a cross-language intelligent search engine to retrieve knowledge in different languages in their native language

Comprehensive Introduction FloatSearch AI is a cross-language intelligent search engine based on artificial intelligence technology, designed to provide users with a more accurate and efficient search experience. It understands users' natural language queries and provides relevant and accurate answers based on semantic analysis.FloatS...
6mos ago
0924
一文说清楚 知识蒸馏 (Distillation):让“小模型”也能拥有“大智慧”

A clear article Knowledge Distillation (Distillation): let the "small model" can also have "big wisdom".

知识蒸馏是一种机器学习技术,目的是将预先训练好的大型模型(即 "教师模型")的学习成果转移到较小的 "学生模型 "中。蒸馏技术可以帮助我们开发更轻量化的生成模型,用于智能对话、内容创作等领域。 最近 ...
6mos ago
01.3K
Langui:开源的AI用户界面组件库

Langui: an open source library of AI user interface components

综合介绍 LangbaseInc的Langui是一个开源的用户界面组件库,专为生成式AI和大语言模型(LLM)项目设计。该库基于Tailwind CSS,提供了一系列预构建的UI组件,帮助开发者快速构...
6mos ago
01K
Qwen2.5-VL 发布:支持长视频理解、视觉定位、结构化输出,开源可微调

Qwen2.5-VL Released: Supports Long Video Understanding, Visual Localization, Structured Output, Open Source Fine-tunable

1.模型介绍 自 Qwen2-VL 发布以来的五个月里,众多开发者在 Qwen2-VL 视觉语言模型上构建了新模型,为Qwen团队提供了宝贵的反馈。在此期间,Qwen团队专注于构建更有用的视觉语言模型...
6mos ago
01.5K
大模型参数量如何计算?7B、13B、65B 究竟代表什么?

How to calculate the number of parameters for a large model, and what do 7B, 13B and 65B stand for?

最近,许多从事大模型训练和推理的朋友都在讨论模型参数量和模型大小之间的关系。例如,著名的羊驼系列 LLaMA 大模型,就包含了 LLaMA-7B、LLaMA-13B、LLaMA-33B 和 LLaMA...
6mos ago
01.5K
DeepSeek发布统一多模态理解与生成模型:从 JanusFlow 到 Janus-Pro

DeepSeek Releases Unified Multimodal Understanding and Generative Models: from JanusFlow to Janus-Pro

JanusFlow 速读 DeepSeek 团队又发新模型,28日凌晨推出了创新型多模态框架 Janus-Pro,这是一个能同时处理多模态理解和生成任务的统一模型。该模型基于 DeepSeek-LLM...
5mos ago
01.1K
百川智能发布Baichuan-Omni-1.5全模态大模型,多项测评超越GPT-4o Mini

Baichuan Intelligence Releases Baichuan-Omni-1.5 Omnimodal Large Model, Surpassing GPT-4o Mini in Several Measurements

临近年终,国内大模型领域再传喜讯。百川智能近期密集发布多款大模型产品,继全场景深度推理模型Baichuan-M1-preview和医疗增强开源模型Baichuan-M1-14B之后,又重磅推出了全模态...
6mos ago
0834
Your Daily Minute:通过AI视频日记提升情绪认知和自我反思

Your Daily Minute: Improving Emotional Awareness and Self-Reflection Through AI Video Journaling

综合介绍 Your Daily Minute是一款创新的视频日记应用,通过AI技术帮助用户记录和理解每日情绪。用户可以每天录制一分钟的视频反思,应用会自动转录并分析情绪内容,提供即时的情绪状态洞察。该...
6mos ago
0891
Taskek:AI驱动的团队协作和项目管理工具

Taskek: AI-powered team collaboration and project management tool

综合介绍 Taskek是一款集成了Trello、Google Docs和Miro功能的AI驱动的生产力工具,适用于从高层建筑到家庭办公室的各类工作环境。它允许团队从简单绘图开始,迅速转化为具体任务,提...
4mos ago
0909