GOT-OCR2.0:基于 QWen2 0.5B 端到端的多模态OCR模型

GOT-OCR2.0 : basé sur le modèle d'OCR multimodal de bout en bout QWen2 0.5B

Introduction complète GOT-OCR2.0 est un modèle de reconnaissance optique de caractères (OCR) Open Source co-proposé par StepStar, qui vise à faire évoluer la technologie OCR vers OCR-2.0 grâce à un modèle unifié de bout en bout. Le modèle prend en charge un large éventail de tâches d'OCR, y compris la reconnaissance de textes normaux, de gr...
Il y a 10 mois
01.7K
DeOldify:使用AI技术为黑白照片和视频上色的经典开源工具

DeOldify : l'outil open source classique pour coloriser les photos et vidéos en noir et blanc à l'aide de techniques d'IA

Introduction complète DeOldify est un projet open source basé sur une technologie d'apprentissage profond dédiée à la coloration intelligente et à la restauration de photos et de vidéos en noir et blanc. Le projet utilise une méthode d'apprentissage NoGAN innovante pour résoudre avec succès les défauts communs des réseaux GAN traditionnels dans le processus de coloration d'image...
Il y a 7 mois
01.7K
OpenBB:开源金融数据分析平台,集成私有数据集和 AI 来增强投资决策

OpenBB : Plateforme d'analyse de données financières open source qui intègre des ensembles de données privées et l'IA pour améliorer la prise de décision en matière d'investissement.

综合介绍 OpenBB 是一个免费且完全开源的金融数据分析平台,旨在为所有人提供便捷的金融数据访问和分析工具。平台集成了超过 100 个不同的数据源,涵盖股票、期权、加密货币、外汇、宏观经济指标、固定...
Il y a 6 mois
01.6K
Novel:模仿Notion AI的开源写作编辑器

Novel : un éditeur d'écriture open source qui imite Notion AI

Introduction complète Il s'agit d'un projet open source développé par Steven Tey appelé Novel, c'est un éditeur de texte WYSIWYG de style Notion, intégrant une fonction d'auto-complétion AI qui peut aider les utilisateurs à améliorer l'efficacité de la saisie de texte. Le projet fournit une documentation détaillée et des instructions d'installation...
Il y a 12 mois
01.6K
ALog:便携AI语音日记应用,支持语音转文字。

ALog : application portable de journal vocal AI avec prise en charge de la synthèse vocale.

Introduction générale ALog est une application de journal vocal basée sur l'IA conçue pour aider les utilisateurs à enregistrer leur vie quotidienne par la voix. Elle est développée par duxins et en libre accès sur GitHub. Les utilisateurs peuvent enregistrer des entrées de journal par saisie vocale, et l'application convertit automatiquement la voix en texte...
Il y a 6 mois
01.6K
Leffa:高保真模特虚拟试穿与人物姿势调整,Meta开源的可控人物图像生成模型

Leffa : Ajustement virtuel de modèle haute fidélité et ajustement de la pose du personnage, modèle de génération d'image de personnage contrôlable Meta open source

Introduction Leffa est un cadre unifié pour la génération d'images de personnages contrôlables, permettant une manipulation précise de l'apparence du personnage (par exemple, l'ajustement virtuel) et de la pose (par exemple, le transfert de la pose). Le cadre réduit considérablement la distorsion des détails les plus fins en orientant la requête cible vers la clé de référence correcte dans la couche d'attention, avec...
Il y a 7 mois
01.6K