PiT : outil permettant de reconstituer des images complètes à partir de parties d'images (non ouvert)

Derniers outils d'IAPosté il y a 4 mois Sharenet.ai
744 0
吐司AI

Introduction générale

PiT(Piece it Together)是一个开源工具,托管在 GitHub 上,由特拉维夫大学的 Elad Richardson 等研究者开发。它能让用户输入零散的图像零件,比如翅膀、发型或眼睛,然后用人工智能技术生成一张完整的图像。PiT 不需要文字描述,直接用图片零件作为输入,依靠预训练模型 IP-Prior 补全缺失部分,最后通过 SDXL 渲染出结果。这个工具适合视觉设计师或研究者,用来快速拼凑创意想法。截至 2025 年 3 月 25 日,PiT 的最新代码和说明可在 GitHub 查看。

PiT:用图像零件拼出完整图像的工具(未开放)

 

Liste des fonctions

  • 零件拼图:输入零散图像零件,生成一张完整的图像。
  • 细节连贯:根据零件特点,补全的图像保持整体一致。
  • 纯图像输入:不需要文字提示,只用图片就能操作。
  • 多样结果:支持不同数量的零件,生成多种可能图像。
  • projet open source:代码在 GitHub 上公开,可自由下载和修改。
  • 风格可选:通过 IP-LoRA 调整,支持生成特定风格的图像。
  • 领域适配:可用不同 IP-Prior 模型,生成适合特定主题的图像。

 

Utiliser l'aide

PiT 是 GitHub 上的开源项目,适合有基础编程能力的用户。以下是详细的安装和使用指南,帮助你快速上手。

Processus d'installation

  1. Préparation de l'environnement
    • 确保电脑有 Python 3.8 或以上版本。
    • 安装 Git(Windows 从 git-scm.com 下载,Mac/Linux 输入 git --version 检查)。
    • 推荐使用带 GPU 的设备(如 NVIDIA 显卡加 CUDA),加快生成速度。无 GPU 也能用,但较慢。
  2. Télécharger le code
    • 打开终端或命令行。
    • 输入命令下载 PiT:
      git clone https://github.com/eladrich/PiT.git
      
    • Allez dans le dossier du projet :
      cd PiT
      
  3. Installation des dépendances
    • 项目需要 Python 库,如 torch,numpy,列表在 requirements.txt Au milieu.
    • 运行命令安装:
      pip install -r requirements.txt
      
    • 若无此文件,参考 README 安装 diffusers,transformers etc.
  4. 获取模型
    • PiT 依赖 IP-Prior 和 IP-Adapter+ 模型,下载链接在 GitHub 或论文(https://arxiv.org/abs/2503.10365)中。
    • 将模型放入指定目录(如 models/),路径看 README。
  5. 安装 SDXL
    • PiT 用 SDXL 渲染图像。安装 diffusers: :
      pip install diffusers
      
    • 从 Hugging Face 下载 SDXL 模型,保存到本地。

Utilisation

  1. 准备零件
    • 收集图像零件(如耳朵、标志),建议用 PNG 格式,背景干净。
    • 放入项目中的输入文件夹(如 input/).
  2. programme de course
    • 在终端进入 PiT 目录。
    • 执行脚本(假设为 generate.py,具体看 README):
      python generate.py --input_dir input/ --output_dir output/
      
    • Paramètre Description :
      • --input_dir:零件文件夹。
      • --output_dir:结果保存文件夹。
    • 程序会用零件生成完整图像。
  3. 查看图像
    • 生成后,打开 output/ 文件夹查看。
    • 若不满意,可多加零件或换清晰图像。

Fonction en vedette Fonctionnement

  • 零件数量
    输入 1 个或多个零件都可以。比如给“爪子”和“尾巴”,生成完整动物。零件风格最好一致。
  • 风格调整
    用 IP-LoRA 可加风格提示。例如:

    python generate.py --input_dir input/ --output_dir output/ --prompt "卡通风格"
    

    就能生成卡通化的图像。

  • 换领域模型
    PiT 支持不同 IP-Prior 模型(如玩具、生物)。切换时加载对应模型文件,操作看 README。
  • 优化结果
    若图像模糊,可检查零件是否清晰,或加参数:

    python generate.py --input_dir input/ --steps 50
    

mise en garde

  • 零件要清楚,避免太小或杂乱。
  • 首次运行慢,后续会快。
  • 出错时按提示安装缺少的库。

这些步骤能帮你用 PiT 拼出完整图像。操作虽需编程,但流程简单。

 

scénario d'application

  1. 设计灵感
    设计师输入零件(如翅膀、帽子),拼出完整角色,快速尝试创意。
  2. 产品概念
    开发者用零件(如按钮、形状)生成新产品图像,探索设计方向。
  3. Apprentissage technique
    研究者用 PiT 测试 AI 如何从零件拼图,了解图像生成原理。

 

QA

  1. PiT 和其他工具区别在哪?
    PiT 用图像零件直接拼图,不需要文字,适合视觉创作。
  2. 必须训练模型吗?
    不必,官方有预训练模型,但可自行训练调整。
  3. 生成速度快吗?
    不算快,需几秒到几分钟,取决于设备。
© déclaration de droits d'auteur
AiPPT

Articles connexes

Pas de commentaires

aucun
Pas de commentaires...