本地部署开源大模型工具

mettre en ordre

poste mise à jour écrémer félicitations

llm.pdf：在PDF文件中运行大型语言模型的实验项目

综合介绍 llm.pdf 是一个开源项目，允许用户在 PDF 文件中直接运行大型语言模型（LLM）。这个项目由 EvanZhouDev 开发，托管在 GitHub 上，展示了一种创新的方法：通过 Em...

Derniers outils d'IA # AI Java Open Source Projecct # Outil de grand modèle à source ouverte déployé localement

Il y a 2 mois

0518

Aana SDK：简易部署多模态AI模型的开源工具

综合介绍 Aana SDK 是一个开源框架，由 Mobius Labs 开发，名字源于马拉雅拉姆语“ആന”（大象）。它帮助开发者快速部署和管理多模态 AI 模型，支持处理文本、图像、音频和视频等多种数...

Derniers outils d'IA # AI Java Open Source Projecct # Outil de grand modèle à source ouverte déployé localement

Il y a 4 mois

0648

BrowserAI : Exécuter des modèles d'IA localement dans le navigateur avec des WebGPUs

综合介绍 BrowserAI 是一个开源工具，让用户直接在浏览器中运行本地 AI 模型。它由 Cloud-Code-AI 团队开发，支持像 Llama、DeepSeek、Kokoro 这样的语言模型...

Derniers outils d'IA # Outil de grand modèle à source ouverte déployé localement

Il y a 4 mois

0714

LitServe：快速部署企业级通用AI模型推理服务

综合介绍 LitServe 是 Lightning AI 推出的一款开源 AI 模型服务引擎，基于 FastAPI 构建，专注于快速部署通用 AI 模型的推理服务。它支持从大型语言模型（LLM）、视觉...

Derniers outils d'IA # AI Java Open Source Projecct # Outil de grand modèle à source ouverte déployé localement

Il y a 4 mois

0636

Nexa : une petite solution d'IA multimodale qui fonctionne localement

综合介绍 Nexa AI 是一个专注于本地运行的多模态AI解决方案的平台。它提供了多种AI模型，包括自然语言处理（NLP）、计算机视觉、语音识别和生成（ASR和TTS）等，所有这些模型都可以在本地设备...

Derniers outils d'IA # Outil de grand modèle à source ouverte déployé localement

il y a 5 mois

01K

vLLM : Un moteur d'inférence et de service LLM pour une utilisation efficace de la mémoire

综合介绍 vLLM是一个高吞吐量和内存高效的推理和服务引擎，专为大语言模型（LLM）设计。该项目最初由加州大学伯克利分校的Sky Computing Lab开发，现已成为一个由学术界和工业界共同驱动的...

Derniers outils d'IA # Outil de grand modèle à source ouverte déployé localement

il y a 5 mois

0916

Llama 3.2 Reasoning WebGPU：在浏览器中运行LLama-3.2

Llama 3.2 Reasoning WebGPU : Exécuter Llama-3.2 dans un navigateur

综合介绍 Transformers.js 是 Hugging Face 提供的一个 JavaScript 库，旨在将最先进的机器学习模型直接在浏览器中运行，无需服务器支持。该库与 Hugging Fa...

Nouvelles de l'IA # AI Java Open Source Projecct # Outil de grand modèle à source ouverte déployé localement

Il y a 6 mois

01K

Harbor : un ensemble d'outils conteneurisés pour déployer des environnements de développement LLM locaux en un seul clic et pour gérer et exécuter facilement des services d'IA.

Introduction générale Harbor est un ensemble d'outils LLM conteneurisés révolutionnaires visant à simplifier le déploiement et la gestion d'environnements de développement d'IA locaux. Il permet aux développeurs de disposer d'une interface de ligne de commande (CLI) propre et d'une application d'accompagnement à lancer et à gérer en un seul clic, y compris les backends LLM, les interfaces API, les...

Derniers outils d'IA # AI Java Open Source Projecct # Outil de grand modèle à source ouverte déployé localement

Il y a 6 mois

01.3K

Xinference：轻松实现分布式AI模型部署和服务

综合介绍 Xorbits Inference（简称Xinference）是一个强大且多功能的库，专注于为语言模型、语音识别模型和多模态模型提供分布式部署和服务。通过Xorbits Inference...

Nouvelles de l'IA # Outil de grand modèle à source ouverte déployé localement

il y a 5 mois

0810

AI Dev Gallery：Windows本地AI模型开发工具集，端侧模型集成到Windows应用

AI Dev Gallery : Windows Native AI Model Development Toolset, End-Side Model Integration into Windows Applications (en anglais)

Introduction générale AI Dev Gallery est une application d'outils de développement d'IA de Microsoft (actuellement en avant-première publique) conçue pour les développeurs Windows. Elle fournit une plateforme complète pour aider les développeurs à intégrer facilement des fonctionnalités d'IA dans leurs...

Derniers outils d'IA # AI Java Open Source Projecct # Outil de grand modèle à source ouverte déployé localement

Il y a 7 mois

01.2K

LightLLM : un cadre léger et efficace pour raisonner et servir de grands modèles de langage

综合介绍 LightLLM 是一个基于 Python 的大语言模型（LLM）推理和服务框架，以其轻量级设计、易于扩展和高效性能而著称。该框架利用了多种知名的开源实现，包括 FasterTransfor...

Derniers outils d'IA # Outil de grand modèle à source ouverte déployé localement

il y a 5 mois

0853

Transformers.js : exécution de près de 700 macromodèles d'IA dans le web local

Introduction générale Transformers.js est une bibliothèque JavaScript développée par Hugging Face pour permettre aux utilisateurs d'exécuter des modèles d'apprentissage automatique de pointe directement dans le navigateur sans support de serveur. La bibliothèque fonctionne en conjonction avec Hugg...

Derniers outils d'IA # Outil de grand modèle à source ouverte déployé localement

Il y a 8 mois

01.3K

GLM Edge：智谱发布适用于手机、车机和PC平台的端侧大语言模型和多模态理解模型

GLM Edge : Smart Spectrum lance des modèles de big language et des modèles de compréhension multimodale pour les plates-formes mobiles, automobiles et PC.

Introduction complète GLM-Edge est une série de grands modèles de langage et de modèles de compréhension multimodale conçus par l'université de Tsinghua (Smart Spectrum Light Language) pour les dispositifs d'extrémité. Ces modèles comprennent GLM-Edge-1.5B-Chat, GLM-Edge-4B-Chat, GLM...

Derniers outils d'IA # Outil de grand modèle à source ouverte déployé localement

Il y a 8 mois

01.3K

EXO : Exécution de grappes d'IA distribuées à l'aide d'appareils domestiques inactifs, prise en charge de plusieurs moteurs d'inférence et découverte automatisée d'appareils.

Introduction générale Exo est un projet open source conçu pour faire fonctionner son propre cluster d'IA en utilisant des appareils de tous les jours (par exemple iPhone, iPad, Android, Mac, Linux, etc.). Grâce au partitionnement dynamique des modèles et à la découverte automatisée des appareils, Exo est capable d'unifier plusieurs appareils en un...

Derniers outils d'IA # AI Java Open Source Projecct # Outil de grand modèle à source ouverte déployé localement

Il y a 8 mois

02.1K

LocalAI：开源的本地AI部署方案，支持多种模型架构，WebUI统一管理模型和API

LocalAI : solutions open source de déploiement de l'IA locale, prise en charge de plusieurs architectures de modèles, gestion unifiée des modèles et des API par l'interface WebUI.

Introduction générale LocalAI est une alternative open source à l'IA locale conçue pour fournir des interfaces API compatibles avec OpenAI, Claude et d'autres. Il peut fonctionner sur du matériel grand public, ne nécessite pas de GPU et est capable de générer du texte, de l'audio, de la vidéo, des images et de cloner des...

Derniers outils d'IA # Outil de grand modèle à source ouverte déployé localement

Il y a 8 mois

01.6K

llamafile：使用单个文件分发和运行 LLMs，简化LLM部署，跨平台支持LLMs

llamafile : distribuer et exécuter des LLM à l'aide d'un seul fichier, simplifier le déploiement des LLM, support multiplateforme pour les LLM

Introduction générale llamafile est un outil du projet Mozilla Builders conçu pour simplifier le déploiement et le fonctionnement du Large Language Model (LLM). En combinant llama.cpp avec Cosmopolitan Libc ...

Derniers outils d'IA # Outil de grand modèle à source ouverte déployé localement

Il y a 6 mois

01.3K

Petals：分布式共享GPU运行和微调大语言模型，像BitTorrent网络一样共享GPU资源

Petals : exécution distribuée et partagée de modèles linguistiques de grande taille sur GPU, partageant les ressources GPU comme un réseau BitTorrent.

Introduction générale Petals est un projet open source développé par le BigScience Workshop pour exécuter de grands modèles de langage (LLM) par le biais d'une approche informatique distribuée. Les utilisateurs peuvent exécuter les LLM chez eux en utilisant des GPU grand public ou Google Co...

Derniers outils d'IA # Mise au point du grand modèle # Outil de grand modèle à source ouverte déployé localement

Il y a 8 mois

01.2K

Aphrodite Engine：高效的LLM推理引擎，支持多种量化格式和分布式推理。

Moteur Aphrodite : un moteur d'inférence LLM efficace qui supporte plusieurs formats de quantification et l'inférence distribuée.

Introduction générale Le moteur Aphrodite est le moteur dorsal officiel de PygmalionAI, conçu pour fournir un point final d'inférence pour les sites PygmalionAI et pour soutenir le déploiement rapide de modèles compatibles avec Hugging Face. Le moteur utilise le p...

Derniers outils d'IA # Outil de grand modèle à source ouverte déployé localement

Il y a 8 mois

01.2K

llama.cpp : outil d'inférence efficace, supporte plusieurs matériels, facile à implémenter l'inférence LLM

Introduction générale llama.cpp est une bibliothèque implémentée en C/C++ pur, conçue pour simplifier le processus d'inférence pour les grands modèles de langage (LLM). Elle prend en charge un large éventail de plates-formes matérielles, y compris Apple Silicon, les GPU NVIDIA et les GPU AMD, et fournit une variété de quant...

Derniers outils d'IA # Outil de grand modèle à source ouverte déployé localement

il y a 5 mois

01.6K

Déploiement local d'outils Open Source pour les grands modèles