안정적인 확산 WebUI 포지: 최적화 및 가속화된 이미지 생성 모델

1.6K 0

일반 소개

Stable Diffusion WebUI Forge는 개발 프로세스를 간소화하고, 리소스 관리를 최적화하며, 추론 처리 속도를 높이기 위해 Stable Diffusion WebUI(Gradio 버전)를 기반으로 구축된 플랫폼입니다. Forge에서 지원하는 기능으로는 GPU 추론 가속, 리소스 관리 최적화, UNet 패치 통합을 간소화하는 새로운 방법, 확장된 개발 편의성 및 자동화된 리소스 관리 등이 있습니다. 또한 개발자는 사용자가 자체 기능을 개발할 수 있도록 샘플 ControlNet 확장 기능을 제공했습니다.

Stable Diffusion WebUI Forge：优化并加速过的图像生成模型

기능 목록

GPU 추론 가속
리소스 관리 최적화
UNet 패치: 통합에 대한 새로운 접근 방식
손쉬운 확장 개발
자동화된 리소스 관리

도움말 사용

최신 코드를 보려면 GitHub 리포지토리를 방문하세요.
문서에 따라 설치 및 실행
안정적인 확산을 통한 이미지 생성 WebUI Forge
UNet 패치 및 ControlNet 예제를 사용하여 사용자 지정 확장 개발하기

원래 WebUI(1024px에서 SDXL 추론의 경우)와 비교하면 다음과 같은 속도 향상을 기대할 수 있습니다:

8GB RAM과 같은 일반적인 GPU를 사용하는 경우 추론 속도(it/s)는 ~30~45%, 최대 GPU 메모리(작업 관리자에서)는 ~700MB에서 1.3GB로, 최대 확산 해상도(메모리 부족이 발생하지 않는 경우)는 ~2배에서 3배, 최대 확산 배치 크기(메모리 부족이 발생하지 않는 경우)는 ~4배에서 3배로 증가할 것으로 예상할 수 있습니다. 최대 확산 해상도(메모리 부족이 발생하지 않는 경우)는 약 2배에서 3배, 최대 확산 배치 크기(메모리 부족이 발생하지 않는 경우)는 약 4배에서 6배로 증가합니다.

6GB RAM과 같은 낮은 성능의 GPU를 사용하는 경우, 추론 속도(it/s)는 ~60~75%, 최대 GPU 메모리(작업 관리자에서)는 ~800MB에서 1.5GB로 감소, 최대 확산 해상도(메모리 부족 발생 없이)는 ~3배 증가, 최대 확산 배치 크기(메모리 부족 발생 없이)는 다음과 같이 증가할 것으로 예상할 수 있습니다. 최대 확산 해상도(메모리 부족 없음)는 약 3배, 최대 확산 배치 크기(메모리 부족 없음)는 약 4배 증가합니다.

비디오 메모리가 24GB인 4090과 같은 고성능 GPU를 사용하는 경우, 추론 속도(it/s)는 약 3~6%, GPU 메모리 스파이크(작업 관리자에서)는 약 1GB에서 1.4GB로 감소, 최대 확산 해상도(메모리 부족 발생 없음)는 약 1.6배, 최대 확산 배치 크기(메모리 부족 없음)는 약 2배 증가할 것으로 예상할 수 있습니다. 메모리 부족 없음)는 약 2배 증가합니다.

SDXL과 함께 컨트롤넷을 사용하면 최대 컨트롤넷 개수(메모리 부족 없이)가 약 2배 증가하고, SDXL+컨트롤넷을 사용하면 속도가 약 30~45% 증가합니다.

Forge가 가져온 또 다른 매우 중요한 변화는 Unet Patcher로, Unet Patcher를 사용하면 약 100줄의 코드로 Self-Attention Guidance, Kohya 고해상도 수정, FreeU, StyleAlign, Hypertile 등과 같은 메서드를 구현할 수 있습니다. Unet Patcher를 사용하면

Unet Patcher 덕분에 이제 SVD, Z123, 마스크드 IP 어댑터, 마스크드 컨트롤넷, 포토메이커 등 많은 새로운 기능을 Forge에서 사용할 수 있고 지원합니다.

더 이상 몽키패치를 하거나 다른 확장 프로그램과 충돌할 필요가 없습니다!

또한 Forge는 DDPM, DDPM Karras, DPM++ 2M 터보, DPM++ 2M SDE 터보, LCM Karras, 오일러 A 터보 등 다양한 샘플러를 추가했습니다(LCM은 1.7.0부터 원래 웹UI에 포함되어 있습니다).