1-2-1-MNVTON:高效图像、视频中人物虚拟试穿服装(待开放)
综合介绍 1-2-1-MNVTON是一个基于GitHub的开源项目,旨在通过“Modality-specific Normalization for Virtual Try-On”(MNVTON)技术...
Kokoro-ONNX : Outil de synthèse vocale efficace avec prise en charge de la sélection multilingue et multi-voix
综合介绍 Kokoro-ONNX是一个基于ONNX runtime的开源文本转语音(TTS)工具。该项目由thewh1teagle开发,旨在提供高效、快速的语音合成解决方案。Kokoro-ONNX支持...
Zerox : PDF, DOCX, conversion d'images en Markdown, modèle visuel OCR de haute précision
Introduction générale Zerox est un projet open source conçu pour convertir des documents PDF, DOCX, des images et d'autres documents au format Markdown par le biais de modèles visuels. Le projet est développé par l'équipe getomni-ai et fournit une solution OCR (Optical Character Recognition) simple et efficace....
AIVLOG : Éditer automatiquement les moments forts de la vidéo, créer facilement des vlogs professionnels
综合介绍 AIVLOG是一款专为Vlog创作者设计的AI视频编辑工具。它能够自动分析视频内容,智能剪辑出精彩片段,节省用户95%的编辑时间。无论是日常生活、旅行记录还是谈话类视频,AIVLOG都能轻松...
Charla : un outil de chat minimaliste basé sur des points d'accès avec une intégration native au backend d'Ollama.
综合介绍 Charla 是一个基于终端的聊天应用程序,旨在与本地语言模型进行对话。该应用程序集成了 Ollama 后端,支持上下文感知的对话,并将聊天会话保存为 Markdown 文件。用户可以通过简...
Mise à jour majeure de Windsurf Wave 2 : introduction de la recherche sur le Web et de la mémoire automatisée avec la version de déploiement hybride d'entreprise
Codeium 近日推出 Windsurf Wave 2 更新,为开发者带来多项重要功能升级,包括 Web 搜索、自动化记忆和代码执行优化等。作为AI Coding工具Top 2,这些更新旨在为 20...
Google lance le moteur Vertex AI RAG : un guichet unique pour la création d'applications génératives fiables, optimisées par la recherche.
L'IA générative et la modélisation du langage étendu (LLM) transforment les industries, mais deux défis majeurs peuvent entraver l'adoption par les entreprises : la désillusion (génération d'informations incorrectes ou dénuées de sens) et la connaissance limitée au-delà de leurs données d'apprentissage. La génération augmentée par récupération (RAG) et l'ancrage ...
MiniRAG : Cadre de génération amélioré pour la recherche simplifiée, index de graphe d'entité rappelant les blocs de texte pertinents.
综合介绍 MiniRAG是一个极其简单的检索增强生成(RAG)框架,旨在通过异构图索引和轻量级拓扑增强检索,使小模型也能实现良好的RAG性能。该项目由香港大学数据科学实验室(HKUDS)开发,主要解决...
Perplexity AI présente une offre de fusion (acquisition) avec l'entreprise américaine TikTok
L'essentiel : Perplexity AI a soumis une offre à la société mère de TikTok, ByteDance, samedi, proposant que Perplexity fusionne avec les opérations américaines de TikTok, a appris CNBC. Une source au fait de la situation a révélé...
Omni-RGPT : un grand modèle multimodal pour la compréhension des régions d'images et de vidéos afin d'améliorer l'analyse du contenu visuel
综合介绍 Omni-RGPT 是一个多模态大语言模型,旨在实现图像和视频的区域级理解。通过引入 Token Mark 技术,Omni-RGPT 能够在视觉特征空间内高亮目标区域,并通过区域提示(如框或...