LOADING

Sharenet.ai

Day arching a pawn and sharing for the king!

posts4083 tools15 book0 app0 Comments0

Cosmos：世界基础模型，构建物理世界的人工智能基础模型平台

Cosmos: World Base Model, a platform for building AI base models of the physical world

综合介绍 NVIDIA Cosmos 是一个面向开发者的世界基础模型平台，专门设计用于帮助物理人工智能开发者更好、更快地构建其物理人工智能系统。该平台提供了一系列预训练模型，包括基于扩散和自回归的世界...

Latest AI tools # AI Open Services # AI Java Open Source Projecct

7mos ago

01.3K

将文字描述或文档转换为美观的概念示意图，快速为PPT或文章配图

Convert text descriptions or documents into beautiful conceptual diagrams and quickly illustrate PPTs or articles.

我觉得大概率是图片、表格、流程图。今天给大家推荐一个免费的AI文本转视觉工具，质感有点牛，感觉像是Figma这样的大厂质感，简约又强大。当然，它也可以是一个很漂亮实用的笔记、文档工具...

AI hands-on tutorials

7mos ago

01.1K

Mini LLM Flow：使用100行代码构建“有向图结构”的LLM微型智能体

Mini LLM Flow: Building LLM Mini-Intelligents with "Directed Graph Structure" in 100 Lines of Code

General Introduction miniLLMFlow is a minimalist Large Language Model (LLM) development framework that contains only 100 lines of core code, demonstrating the design philosophy of "keeping it simple". The framework is specifically designed to enable AI assistants (e.g. ChatGPT, Claude, etc.) to...

Latest AI tools # AI Java Open Source Projecct # Intelligent Body Development Framework

7mos ago

01.2K

GraphReader:基于图的智能体，增强大型语言模型的长文本处理能力

GraphReader: Graph-based Intelligents to Enhance Long Text Processing for Large Language Models

GraphReader:基于图的智能体，增强大型语言模型的长文本处理能力图解专家：像个善于制作思维导图的导师，将冗长的文本转化为清晰的知识网络，让AI能够像沿着地图探索一样，轻松找到答案需要的各个关...

AI Knowledge Base

7mos ago

01.1K

微信语音消息还能这样玩？小白也能用 Devbox 轻松实现公众号语音转文字！

WeChat voice messages can be played like this? Even a beginner can use Devbox to easily realize public number voice to text!

很多人会想直接使用微信的语音输入，说的总比打字快。与常见的 .mp3 和 .wav 格式不同，微信语音输入默认使用的是 .amr 格式。下图为开发者服务器接收到来自微信的 webhook，表示公众...

AI hands-on tutorials

7mos ago

01.1K

小智 AI 聊天机器人：打造你的AI聊天伴侣，轻松实现语音对话和智能互动

Xiaozhi AI Chatbot: Build your AI chatting companion, easily realize voice conversation and intelligent interaction

综合介绍小智 AI 聊天机器人是一个基于ESP32开发板的开源项目，旨在帮助用户构建自己的AI聊天伴侣。该项目由虾哥开发，主要用于教学目的，帮助更多人入门AI硬件开发，并了解如何将大语言模型应用到实...

Latest AI tools # AI Java Open Source Projecct # Multimodal Real-Time Interactive Products

4mos ago

02K

DashInfer-VLM，多模态SOTA推理性能，超vLLM！

DashInfer-VLM, multimodal SOTA inference performance over vLLM!

引言 DashInfer-VLM是一个针对于视觉多模态大模型VLM的推理架构，特别优化了Qwen VL模型的推理加速，DashInfer-VLM和其他的VLM的推理加速框架最大的区别是，它把VIT部...

7mos ago

01.4K

将描述业务流程的文档转换为业务流程图：以辅导公司上市文档为例

Converting a document describing a business process into a business process diagram: an example of a document for coaching a company to go public

群里有人问：哪位前辈知道哪个ai可以把上市公司信息画出流程图的？猜测是上市辅导文件相关的流程，其实不需要任何工具，只要能画出来一个示例流程图，让大模型生成SVG代码即可，当然Mermaid语法也可以...

AI hands-on tutorials

7mos ago

01.2K

OpenAI Realtime API Next.js：构建实时语音对话AI应用的Next.js模板

OpenAI Realtime API Next.js: a Next.js template for building real-time voice conversation AI applications

综合介绍 OpenAI Realtime API Next.js 是一个基于Next.js框架的开源项目，旨在帮助开发者快速构建实时语音AI应用。该项目集成了OpenAI的实时API和WebRTC技术...

Latest AI tools # AI Java Open Source Projecct # Multimodal Real-Time Interactive Products

7mos ago

01.3K

Film-Scan-Converter：扫描RAW图像格式的胶片转换为成品图像

Film-Scan-Converter: Scanning of RAW image format film for conversion to finished images

综合介绍 Film-Scan-Converter是一个开源的Python脚本，专门用于处理数码相机拍摄的RAW胶片扫描图像。该脚本能够将RAW格式的胶片扫描图像转换为最终的可用图像，适用于摄影爱好者和...

Latest AI tools # AI Image Style Control

7mos ago

01.1K