Sharenet.ai

日拱一卒,分享为王!
Cosmos:世界基础模型,构建物理世界的人工智能基础模型平台

Cosmos:世界基础模型,构建物理世界的人工智能基础模型平台

综合介绍 NVIDIA Cosmos 是一个面向开发者的世界基础模型平台,专门设计用于帮助物理人工智能开发者更好、更快地构建其物理人工智能系统。该平台提供了一系列预训练模型,包括基于扩散和自回归的世界...
7个月前
01.3K
将文字描述或文档转换为美观的概念示意图,快速为PPT或文章配图

将文字描述或文档转换为美观的概念示意图,快速为PPT或文章配图

我觉得大概率是图片、表格、流程图。 今天给大家推荐一个免费的AI文本转视觉工具,质感有点牛,感觉像是Figma这样的大厂质感,简约又强大。 当然,它也可以是一个很漂亮实用的笔记、文档工具...
7个月前
01.1K
Mini LLM Flow:使用100行代码构建“有向图结构”的LLM微型智能体

Mini LLM Flow:使用100行代码构建“有向图结构”的LLM微型智能体

综合介绍 miniLLMFlow是一个极简主义的大语言模型(LLM)开发框架,其核心代码仅包含100行,彰显了"大道至简"的设计理念。该框架专门设计用于让AI助手(如ChatGPT、Claude等)能...
7个月前
01.2K
GraphReader:基于图的智能体,增强大型语言模型的长文本处理能力

GraphReader:基于图的智能体,增强大型语言模型的长文本处理能力

GraphReader:基于图的智能体,增强大型语言模型的长文本处理能力 图解专家:像个善于制作思维导图的导师,将冗长的文本转化为清晰的知识网络,让AI能够像沿着地图探索一样,轻松找到答案需要的各个关...
7个月前
01.1K
微信语音消息还能这样玩?小白也能用 Devbox 轻松实现公众号语音转文字!

微信语音消息还能这样玩?小白也能用 Devbox 轻松实现公众号语音转文字!

很多人会想直接使用微信的语音输入,说的总比打字快。 与常见的 .mp3 和 .wav 格式不同,微信语音输入默认使用的是 .amr 格式。 下图为开发者服务器接收到来自微信的 webhook,表示公众...
7个月前
01.1K
小智 AI 聊天机器人:打造你的AI聊天伴侣,轻松实现语音对话和智能互动

小智 AI 聊天机器人:打造你的AI聊天伴侣,轻松实现语音对话和智能互动

综合介绍 小智 AI 聊天机器人是一个基于ESP32开发板的开源项目,旨在帮助用户构建自己的AI聊天伴侣。该项目由虾哥开发,主要用于教学目的,帮助更多人入门AI硬件开发,并了解如何将大语言模型应用到实...
4个月前
02K
DashInfer-VLM,多模态SOTA推理性能,超vLLM!

DashInfer-VLM,多模态SOTA推理性能,超vLLM!

引言 DashInfer-VLM是一个针对于视觉多模态大模型VLM的推理架构,特别优化了Qwen VL模型的推理加速,DashInfer-VLM和其他的VLM的推理加速框架最大的区别是, 它把VIT部...
7个月前
01.4K
将描述业务流程的文档转换为业务流程图:以辅导公司上市文档为例

将描述业务流程的文档转换为业务流程图:以辅导公司上市文档为例

群里有人问:哪位前辈知道哪个ai可以把上市公司信息画出流程图的? 猜测是上市辅导文件相关的流程,其实不需要任何工具,只要能画出来一个示例流程图,让大模型生成SVG代码即可,当然Mermaid语法也可以...
7个月前
01.2K
OpenAI Realtime API Next.js:构建实时语音对话AI应用的Next.js模板

OpenAI Realtime API Next.js:构建实时语音对话AI应用的Next.js模板

综合介绍 OpenAI Realtime API Next.js 是一个基于Next.js框架的开源项目,旨在帮助开发者快速构建实时语音AI应用。该项目集成了OpenAI的实时API和WebRTC技术...
7个月前
01.3K
Film-Scan-Converter:扫描RAW图像格式的胶片转换为成品图像

Film-Scan-Converter:扫描RAW图像格式的胶片转换为成品图像

综合介绍 Film-Scan-Converter是一个开源的Python脚本,专门用于处理数码相机拍摄的RAW胶片扫描图像。该脚本能够将RAW格式的胶片扫描图像转换为最终的可用图像,适用于摄影爱好者和...
7个月前
01.1K