색상: 고품질 이미지 생성을 위한 텍스트-이미지 변환 모델, 중국어 포스터 생성 지원
일반 소개
Kolors는 레이서 팀이 잠재적 확산 기법을 기반으로 개발한 대규모 텍스트-이미지 생성 모델입니다. 이 모델은 수십억 개의 텍스트-이미지 데이터 쌍으로 학습되었으며 영어와 중국어 입력을 모두 지원하여 의미론적으로 정확한 고품질 이미지를 생성할 수 있으며, 시각 품질, 복잡한 의미 정확도 및 텍스트 렌더링에서 상당한 이점을 보여 주며 가상 시착, 이미지 복원 및 개인화된 이미지 생성과 같은 다양한 애플리케이션 시나리오에 적합합니다.

기능 목록
- 텍스트를 이미지로 생성: 텍스트 설명을 입력하여 고품질 이미지를 생성합니다.
- 다국어 지원중국어 및 영어 입력을 지원하여 해당 언어로 이미지를 생성합니다.
- 가상 체험다양한 의상 스타일을 입어볼 수 있는 가상 입어보기 기능을 제공합니다.
- 이미지 복원이미지 디테일을 복구하고 다듬어 이미지 품질을 개선합니다.
- 개인화된 이미지 생성사용자 요구 사항에 따라 개인화된 이미지를 생성합니다.
- 모델 학습 및 추론모델 트레이닝 및 추론 코드를 제공하여 2차 개발을 용이하게 합니다.
도움말 사용
설치 프로세스
- 환경 준비::
- Python 3.8 이상을 설치합니다.
- PyTorch 1.13.1 이상을 설치합니다.
- 트랜스포머 4.26.1 이상을 설치합니다.
- CUDA 11.7 이상을 권장합니다.
- 리포지토리를 복제하고 종속 요소를 설치합니다.::
apt-get install git-lfs git
git clone https://github.com/Kwai-Kolors/Kolors
cd Kolors
conda create --name kolors python=3.8
conda activate kolors
pip install -r requirements.txt
python3 setup.py install
- 모델 가중치 다운로드::
huggingface-cli download --resume-download Kwai-Kolors/Kolors --local-dir weights/Kolors
사용 프로세스
- 텍스트를 이미지로 생성::
- 다음 명령을 실행하여 이미지를 생성합니다:
python3 scripts/sample.py "一张瓢虫的照片,微距,变焦,高质量,电影,拿着一个牌子,写着‘可图’"
- 생성된 이미지는
scripts/outputs/sample_test.jpg
.
- 디퓨저 사용::
- 상담디퓨저 사용 지침.
- 가상 체험::
- 색상의 가상 입어보기 페이지를 방문하여 사진을 업로드하고 의상 스타일을 선택하면 어떤 옷을 입어볼 수 있는지 확인할 수 있습니다.
- 이미지 복원::
- 색상이 제공하는 이미지 복구 기능을 사용하여 복구할 이미지를 업로드하면 시스템이 자동으로 이미지 세부 정보를 복구합니다.
- 개인화된 이미지 생성::
- 개인화된 요구 사항에 대한 설명을 입력하면 색상이 설명에 따라 규정을 준수하는 이미지를 생성합니다.
주의
- 색상은 완전히 오픈 소스이며 학술 연구용으로만 사용됩니다. 商业用途需填写问卷并发送至kwai-kolors@kuaishou.com进行注册.
- 오픈소스 라이선스를 엄격히 준수하고 국가와 사회에 해를 끼칠 수 있는 목적으로 모델을 사용하지 마세요.
© 저작권 정책
이 글은 저작권이 있으며 무단으로 복제해서는 안 됩니다.
관련 문서
댓글 없음...