색상: 고품질 이미지 생성을 위한 텍스트-이미지 변환 모델, 중국어 포스터 생성 지원

최신 AI 도구5개월 전에 게시 됨 Sharenet.ai
993 0
Trae

일반 소개

Kolors는 레이서 팀이 잠재적 확산 기법을 기반으로 개발한 대규모 텍스트-이미지 생성 모델입니다. 이 모델은 수십억 개의 텍스트-이미지 데이터 쌍으로 학습되었으며 영어와 중국어 입력을 모두 지원하여 의미론적으로 정확한 고품질 이미지를 생성할 수 있으며, 시각 품질, 복잡한 의미 정확도 및 텍스트 렌더링에서 상당한 이점을 보여 주며 가상 시착, 이미지 복원 및 개인화된 이미지 생성과 같은 다양한 애플리케이션 시나리오에 적합합니다.

Kolors:生成高质量图像的文本到图像模型,支持生成中文海报

 

기능 목록

  • 텍스트를 이미지로 생성: 텍스트 설명을 입력하여 고품질 이미지를 생성합니다.
  • 다국어 지원중국어 및 영어 입력을 지원하여 해당 언어로 이미지를 생성합니다.
  • 가상 체험다양한 의상 스타일을 입어볼 수 있는 가상 입어보기 기능을 제공합니다.
  • 이미지 복원이미지 디테일을 복구하고 다듬어 이미지 품질을 개선합니다.
  • 개인화된 이미지 생성사용자 요구 사항에 따라 개인화된 이미지를 생성합니다.
  • 모델 학습 및 추론모델 트레이닝 및 추론 코드를 제공하여 2차 개발을 용이하게 합니다.

 

도움말 사용

설치 프로세스

  1. 환경 준비::
    • Python 3.8 이상을 설치합니다.
    • PyTorch 1.13.1 이상을 설치합니다.
    • 트랜스포머 4.26.1 이상을 설치합니다.
    • CUDA 11.7 이상을 권장합니다.
  2. 리포지토리를 복제하고 종속 요소를 설치합니다.::
   apt-get install git-lfs git
git clone https://github.com/Kwai-Kolors/Kolors
cd Kolors
conda create --name kolors python=3.8
conda activate kolors
pip install -r requirements.txt
python3 setup.py install
  1. 모델 가중치 다운로드::
   huggingface-cli download --resume-download Kwai-Kolors/Kolors --local-dir weights/Kolors

사용 프로세스

  1. 텍스트를 이미지로 생성::
    • 다음 명령을 실행하여 이미지를 생성합니다:
     python3 scripts/sample.py "一张瓢虫的照片,微距,变焦,高质量,电影,拿着一个牌子,写着‘可图’"
    
    • 생성된 이미지는scripts/outputs/sample_test.jpg.
  2. 디퓨저 사용::
  3. 가상 체험::
    • 색상의 가상 입어보기 페이지를 방문하여 사진을 업로드하고 의상 스타일을 선택하면 어떤 옷을 입어볼 수 있는지 확인할 수 있습니다.
  4. 이미지 복원::
    • 색상이 제공하는 이미지 복구 기능을 사용하여 복구할 이미지를 업로드하면 시스템이 자동으로 이미지 세부 정보를 복구합니다.
  5. 개인화된 이미지 생성::
    • 개인화된 요구 사항에 대한 설명을 입력하면 색상이 설명에 따라 규정을 준수하는 이미지를 생성합니다.

주의

  • 색상은 완전히 오픈 소스이며 학술 연구용으로만 사용됩니다. 商业用途需填写问卷并发送至kwai-kolors@kuaishou.com进行注册.
  • 오픈소스 라이선스를 엄격히 준수하고 국가와 사회에 해를 끼칠 수 있는 목적으로 모델을 사용하지 마세요.
© 저작권 정책
AiPPT

관련 문서

댓글 없음

없음
댓글 없음...