색상: 고품질 이미지 생성을 위한 텍스트-이미지 변환 모델, 중국어 포스터 생성 지원

1.3K 0

일반 소개

Kolors는 레이서 팀이 잠재적 확산 기법을 기반으로 개발한 대규모 텍스트-이미지 생성 모델입니다. 이 모델은 수십억 개의 텍스트-이미지 데이터 쌍으로 학습되었으며 영어와 중국어 입력을 모두 지원하여 의미론적으로 정확한 고품질 이미지를 생성할 수 있으며, 시각 품질, 복잡한 의미 정확도 및 텍스트 렌더링에서 상당한 이점을 보여 주며 가상 시착, 이미지 복원 및 개인화된 이미지 생성과 같은 다양한 애플리케이션 시나리오에 적합합니다.

기능 목록

텍스트를 이미지로 생성: 텍스트 설명을 입력하여 고품질 이미지를 생성합니다.
다국어 지원중국어 및 영어 입력을 지원하여 해당 언어로 이미지를 생성합니다.
가상 체험다양한 의상 스타일을 입어볼 수 있는 가상 입어보기 기능을 제공합니다.
이미지 복원이미지 디테일을 복구하고 다듬어 이미지 품질을 개선합니다.
개인화된 이미지 생성사용자 요구 사항에 따라 개인화된 이미지를 생성합니다.
모델 학습 및 추론모델 트레이닝 및 추론 코드를 제공하여 2차 개발을 용이하게 합니다.

도움말 사용

설치 프로세스

환경 준비::
- Python 3.8 이상을 설치합니다.
- PyTorch 1.13.1 이상을 설치합니다.
- 트랜스포머 4.26.1 이상을 설치합니다.
- CUDA 11.7 이상을 권장합니다.
리포지토리를 복제하고 종속 요소를 설치합니다.::

   apt-get install git-lfs git
git clone https://github.com/Kwai-Kolors/Kolors
cd Kolors
conda create --name kolors python=3.8
conda activate kolors
pip install -r requirements.txt
python3 setup.py install

모델 가중치 다운로드::

   huggingface-cli download --resume-download Kwai-Kolors/Kolors --local-dir weights/Kolors

사용 프로세스

텍스트를 이미지로 생성::
- 다음 명령을 실행하여 이미지를 생성합니다:
```
 python3 scripts/sample.py "一张瓢虫的照片，微距，变焦，高质量，电影，拿着一个牌子，写着‘可图’"
```
- 생성된 이미지는scripts/outputs/sample_test.jpg.
디퓨저 사용::
- 상담디퓨저 사용 지침.
가상 체험::
- 색상의 가상 입어보기 페이지를 방문하여 사진을 업로드하고 의상 스타일을 선택하면 어떤 옷을 입어볼 수 있는지 확인할 수 있습니다.
이미지 복원::
- 색상이 제공하는 이미지 복구 기능을 사용하여 복구할 이미지를 업로드하면 시스템이 자동으로 이미지 세부 정보를 복구합니다.
개인화된 이미지 생성::
- 개인화된 요구 사항에 대한 설명을 입력하면 색상이 설명에 따라 규정을 준수하는 이미지를 생성합니다.