GPUStack: 대규모 언어 모델을 실행하고 LLM을 위한 공통 추론 서비스를 빠르게 통합하기 위해 GPU 클러스터를 관리합니다.

1.4K 0

일반 소개

GPUStack 是一个开源的 GPU 集群管理工具，专为运行大语言模型（LLMs）而设计。它支持多种硬件，包括 Apple MacBooks、Windows PCs 和 Linux 服务器，能够轻松扩展 GPU 数量和节点，以满足不断增长的计算需求。GPUStack 提供分布式推理功能，支持单节点多 GPU 和多节点推理与服务，兼容 OpenAI API，简化用户和 API 密钥管理，并实时监控 GPU 性能和利用率。其轻量级 Python 包设计，确保最小的依赖和操作开销，是开发者和研究人员的理想选择。

기능 목록

支持多种硬件：兼容 Apple Metal、NVIDIA CUDA、Ascend CANN、Moore Threads MUSA 等。
分布式推理：支持单节点多 GPU 和多节点推理与服务。
多种推理后端：支持 llama-box（llama.cpp）和 vLLM。
轻量级 Python 包：最小依赖和操作开销。
OpenAI 兼容 API：提供与 OpenAI 标准兼容的 API 服务。
用户和 API 密钥管理：简化用户和 API 密钥管理。
GPU 性能监控：实时监控 GPU 性能和利用率。
令牌使用和速率监控：有效管理令牌使用和速率限制。

도움말 사용

설치 프로세스

Linux 或 MacOS

打开终端。
运行以下命令安装 GPUStack：

   curl -sfL https://get.gpustack.ai | sh -s -

安装完成后，GPUStack 将作为服务运行在 systemd 或 launchd 系统上。

Windows(컴퓨터)

以管理员身份运行 PowerShell（避免使用 PowerShell ISE）。
运行以下命令安装 GPUStack：

   Invoke-Expression (Invoke-WebRequest -Uri "https://get.gpustack.ai" -UseBasicParsing).Content

사용 가이드라인

初始设置

访问 GPUStack UI：在浏览器中打开 http://myserver.
使用默认用户名 admin 和初始密码登录。获取初始密码的方法：
- Linux 或 MacOS：运行 cat /var/lib/gpustack/initial_admin_password.
- Windows：运行 Get-Content -Path "$env:APPDATA\gpustack\initial_admin_password" -Raw.

创建 API 密钥

登录 GPUStack UI 后，点击导航菜单中的“API Keys”。
点击“New API Key”按钮，填写名称并保存。
复制生成的 API 密钥并妥善保存（仅在创建时可见）。

使用 API

환경 변수 설정하기:

   export GPUSTACK_API_KEY=myapikey

使用 curl 访问 OpenAI 兼容 API：

   curl http://myserver/v1-openai/chat/completions \
-H "Content-Type: application/json" \
-H "Authorization: Bearer $GPUSTACK_API_KEY" \
-d '{
"model": "llama3.2",
"messages": [
{"role": "system", "content": "You are a helpful assistant."},
{"role": "user", "content": "Hello!"}
],
"stream": true
}'

运行和聊天

在终端中运行以下命令与 llama3.2 模型聊天：

   gpustack chat llama3.2 "tell me a joke."

在 GPUStack UI 中点击“Playground”进行交互。

监控和管理

实时监控 GPU 性能和利用率。
管理用户和 API 密钥，跟踪令牌使用和速率。

支持的模型和平台

支持的模型：LLaMA、Mistral 7B、Mixtral MoE、Falcon、Baichuan、Yi、Deepseek、Qwen、Phi、Grok-1 等。
支持的多模态模型：Llama3.2-Vision、Pixtral、Qwen2-VL、LLaVA、InternVL2 等。
支持的平台：MacOS、Linux、Windows。
支持的加速器：Apple Metal、NVIDIA CUDA、Ascend CANN、Moore Threads MUSA，未来计划支持 AMD ROCm、Intel oneAPI、Qualcomm AI Engine。

文档和社区

官方文档：访问 GPUStack 文档获取完整的使用指南和 API 文档。
贡献指南：阅读 기여 가이드라인 了解如何为 GPUStack 做出贡献。

최신 AI 도구 # AI 오픈 서비스

이 글은 저작권이 있으며 무단으로 복제해서는 안 됩니다.

302.AI: 종량제 AI 서비스 플랫폼, AI 로봇의 신속한 통합, AI 패키징 도구, API 포워딩 인터페이스

최신 AI 도구 # AI 오픈 서비스

9개월 전

01.2K

RAGLite: 여러 데이터베이스와 언어 모델을 지원하는 효율적인 검색 증강 생성(RAG) 도구입니다.

8개월 전

01.4K

HiDream（智象大模型）：基于视觉多模态基础模型的AIGC创作平台

6개월 전

01.5K

Quanta Quest：端侧大模型与面向个人数据的本地化AI搜索平台（预览版）

Quanta Quest: 개인 데이터를 위한 엔드사이드 빅데이터 모델 및 현지화된 AI 검색 플랫폼(미리 보기)

9개월 전

01.2K

댓글 없음

댓글 없음...

GPUStack: 대규모 언어 모델을 실행하고 LLM을 위한 공통 추론 서비스를 빠르게 통합하기 위해 GPU 클러스터를 관리합니다.

일반 소개

기능 목록

도움말 사용

설치 프로세스

Linux 或 MacOS

Windows(컴퓨터)

사용 가이드라인

初始设置

创建 API 密钥

使用 API

运行和聊天

监控和管理

支持的模型和平台

文档和社区

OpenAlternative：精选常用SaaS产品的开源软件替代方案，寻找最佳开源替代方案

RMBG-2-Studio：批量移除图像和视频背景的开源程序，基于RMBG 2.0优化

관련 문서

302.AI: 종량제 AI 서비스 플랫폼, AI 로봇의 신속한 통합, AI 패키징 도구, API 포워딩 인터페이스

RAGLite: 여러 데이터베이스와 언어 모델을 지원하는 효율적인 검색 증강 생성(RAG) 도구입니다.

HiDream（智象大模型）：基于视觉多模态基础模型的AIGC创作平台

Quanta Quest: 개인 데이터를 위한 엔드사이드 빅데이터 모델 및 현지화된 AI 검색 플랫폼(미리 보기)

댓글 없음

최신 기사

GPUStack: 대규모 언어 모델을 실행하고 LLM을 위한 공통 추론 서비스를 빠르게 통합하기 위해 GPU 클러스터를 관리합니다.

일반 소개

기능 목록

도움말 사용

설치 프로세스

Linux 或 MacOS

Windows(컴퓨터)

사용 가이드라인

初始设置

创建 API 密钥

使用 API

运行和聊天

监控和管理

支持的模型和平台

文档和社区

OpenAlternative：精选常用SaaS产品的开源软件替代方案，寻找最佳开源替代方案

RMBG-2-Studio：批量移除图像和视频背景的开源程序，基于RMBG 2.0优化

관련 문서

302.AI: 종량제 AI 서비스 플랫폼, AI 로봇의 신속한 통합, AI 패키징 도구, API 포워딩 인터페이스

RAGLite: 여러 데이터베이스와 언어 모델을 지원하는 효율적인 검색 증강 생성(RAG) 도구입니다.

HiDream（智象大模型）：基于视觉多模态基础模型的AIGC创作平台

Quanta Quest: 개인 데이터를 위한 엔드사이드 빅데이터 모델 및 현지화된 AI 검색 플랫폼(미리 보기)

댓글 없음

선택한 AI 도구

최신 기사