안정적인 확산을 사용하여 AI 생성 이미지를 생성하는 방법

안정적인 확산을 사용하여 AI 생성 이미지를 생성하는 방법

ChatGPT와 같은 인공 지능 챗봇은 최근 엄청나게 강력해졌습니다. 그러나 AI 이미지 생성기(예: Stable Diffusion, DALL-E 및 Midjourney)를 잊지 마십시오. 몇 단어만 제공되면 거의 모든 이미지를 만들 수 있습니다. 컴퓨터에서 Stable Diffusion을 실행하여 제한 없이 무료로 이 작업을 수행하는 방법을 배우려면 이 튜토리얼을 따르십시오.

안정적인 확산이란 무엇입니까?

Stable Diffusion은 무료 오픈 소스 텍스트-이미지 기계 학습 모델입니다. 기본적으로 텍스트를 사용하여 그림을 설명하고 이미지를 생성할 수 있는 프로그램입니다. 수십억 개의 이미지와 함께 제공되는 텍스트 설명이 제공되었으며 이를 분석하고 재구성하는 방법을 배웠습니다.

Stable Diffusion은 직접 사용하는 프로그램이 아닙니다. 다른 프로그램에서 사용하는 기본 소프트웨어 도구라고 생각하면 됩니다. 이 튜토리얼은 컴퓨터에 Stable Diffusion 프로그램을 설치하는 방법을 보여줍니다. Stable Diffusion을 사용하는 많은 프로그램과 웹사이트가 있지만 많은 프로그램과 웹사이트에서 비용을 청구하고 제어할 수 없습니다.

시스템 요구 사항

목표로 삼아야 할 대략적인 지침은 다음과 같습니다.

  • macOS: Apple Silicon(M 시리즈 칩)
  • Windows 또는 Linux: NVIDIA 또는 AMD GPU
  • RAM: 최상의 결과를 위한 16GB
  • GPU VRAM: 최소 4GB
  • 저장 공간: 최소 15GB

AUTOMATIC1111 웹 UI 설치

우리는 모든 주요 데스크톱 운영 체제에서 사용할 수 있는 AUTOMATIC1111 웹 UI 프로그램을 사용하여 Stable Diffusion에 액세스하고 있습니다. “stable-diffiusion-webui” 디렉토리가 다운로드되는 위치를 기록해 두십시오.

macOS의 AUTOMATIC1111 웹 UI

  • 터미널에서 다음 명령을 입력하여 Homebrew를 설치합니다.

/bin/bash -c "$(curl -fsSL https://raw.githubusercontent.com/Homebrew/install/HEAD/install.sh)"

안정적인 확산 Macos Homebrew 설치
  • Homebrew를 PATH에 추가하기 위한 두 명령을 복사하고 입력합니다.
안정적인 확산 Macos 경로에 자작나무 추가
  • 터미널을 종료했다가 다시 열고 다음을 입력하십시오.

brew install cmake protobuf rust python@3.10 git wget

안정적인 확산 Macos Brew 설치 종속성
  • 입력하다:

git clone https://github.com/AUTOMATIC1111/stable-diffusion-webui

안정적인 확산 Macos Git Clone 웹 Ui

Windows의 AUTOMATIC1111 웹 UI

Stable Diffusion Windows Python 웹 사이트 Stable 릴리스 3 10 1
  • Python 설치 프로그램을 실행하고 “Add python.exe to PATH”를 선택한 다음 “지금 설치”를 클릭합니다.
안정적인 확산 Windows Install Python 3 경로에 추가
안정적인 확산 Windows Github 코드 다운로드

Linux의 AUTOMATIC1111 웹 UI

  • 터미널을 엽니다.
안정적인 확산 리눅스 오픈 터미널
  • Linux의 특성에 따라 다음 명령 중 하나를 입력하십시오.

Ubuntu를 포함한 Debian 기반:

sudo apt-get updatesudo apt install wget git python3 python3-ven

Red Hat 기반:

sudo dnf install wget git python3

아치 기반:

sudo pacman -S wget git python3

  • 다음 명령을 실행하여 “/home/$(whoami)/stable-diffusion-webui/”에 설치합니다.

bash <(wget -qO- https://raw.githubusercontent.com/AUTOMATIC1111/stable-diffusion-webui/master/webui.sh)

안정적인 확산 Linux 설치 웹 Ui

모델 설치

웹 UI를 사용하기 전에 최소한 하나의 모델을 추가해야 합니다.

  • 시비타이 로 이동합니다 .
  • 다운로드 버튼의 드롭다운 화살표를 클릭하고 “Model SafeTensor”를 선택합니다.
안정적인 확산 Civit Ai 고의적 다운로드 모델 Safetensor 1
  • 이동합니다. 2단계에서 “stable-diffiusion-webui/models/Stable-diffusion” 폴더에 다운로드한 safetensors 파일.
안정적인 확산 Webui 모델 폴더 1로 이동

웹 UI 실행 및 구성

이제 웹 브라우저에서 Stable Diffusion 프로그램을 실행하고 시작할 준비가 되었습니다.

  • 터미널에서 “stable-diffusion-webui” 디렉토리를 열고 ./webui.sh --xformersLinux/macOS 또는 ./webui-user.batWindows용 명령을 입력합니다. 완료되면 http://127.0.0.1:7860과 같은 “로컬 URL에서 실행” 옆의 URL을 선택하여 복사합니다.
안정적인 확산 Webui Xformers 로컬 URL
  • 브라우저 주소 표시줄에 링크를 붙여넣고 를 누르십시오 Enter. 웹 UI 웹사이트가 나타납니다.
안정적인 확산 Webui 웹사이트 브라우저
  • 더 나은 결과를 위해 몇 가지 설정을 변경해 보겠습니다. “설정 -> 안정적인 확산”으로 이동합니다.
안정적인 확산 설정 안정적인 확산
  • 아래로 스크롤하여 “더 선명하고 깨끗한 결과를 위해 K 샘플러에서 양자화 활성화”를 선택합니다.
안정적인 확산 설정 양자화 K 샘플러 선명한 클리너
  • 위로 스크롤하여 ‘설정 적용’을 클릭한 다음 ‘UI 다시 로드’를 클릭합니다.
안정적인 확산 설정 설정 적용 Ui 다시 로드

FYI: 이미지 소스를 찾아야 하는 경우 Google을 사용하십시오.

txt2txt를 사용하여 개념 이미지 생성

이제 재미있는 부분이 있습니다. 초기 이미지를 만들고 원하는 모양과 가장 유사한 이미지를 검색합니다.

  • “txt2img” 탭으로 이동합니다.
  • 첫 번째 프롬프트 텍스트 상자에 이미지를 설명하는 단어를 쉼표로 구분하여 입력합니다. “현실적”, “자세한” 또는 “클로즈업 초상화”와 같은 이미지 스타일을 설명하는 단어를 포함하는 데 도움이 됩니다.
안정적인 확산 Txt2img 프롬프트
  • 아래의 제외 프롬프트 텍스트 상자에 이미지를 표시하고 싶지 않은 키워드를 입력하십시오. 예를 들어 사실적인 이미지를 만들려는 경우 ‘비디오 게임’, ‘예술’, ‘일러스트’와 같은 단어를 추가하세요.
안정적인 확산 Txt2img 부정적인 프롬프트
  • 아래로 스크롤하여 “배치 크기”를 “4”로 설정합니다. 이렇게 하면 Stable Diffusion이 프롬프트에서 4개의 다른 이미지를 생성합니다.
안정적인 확산 배치 크기 4
  • Stable Diffusion이 프롬프트 키워드를 더 엄격하게 따르도록 하려면 “CFG 척도”를 더 높게 설정하고 더 창의적으로 하려면 더 낮은 값으로 설정하십시오. 낮은 값(예: 기본값 7)은 일반적으로 품질이 좋고 독창적인 이미지를 생성합니다.
안정적인 확산 Cfg 스케일
  • 지금은 다른 설정을 기본값으로 둡니다. Stable Diffusion 작업을 시작하려면 상단의 큰 “Generate” 버튼을 클릭하십시오.
안정적인 확산 Txt2img 생성 버튼 1
  • “생성” 버튼 아래에서 이미지 축소판을 클릭하여 미리 보고 마음에 드는지 결정합니다.
안정적인 확산 Txt2img 결과

이미지가 마음에 들지 않으면 약간 변형하여 1~5단계를 반복합니다.

전체적으로 하나의 이미지가 마음에 들지만 수정하거나 문제(왜곡된 얼굴, 해부학적 문제 등)를 수정하려면 “img2img로 보내기” 또는 “inpaint로 보내기”를 클릭하십시오. 이렇게 하면 이미지가 복사되고 이미지를 개선할 수 있는 해당 탭으로 프롬프트가 표시됩니다.

안정적인 확산 Img2img로 보내기

이미지가 매우 흥미롭거나 좋은 경우 “저장” 버튼을 클릭한 다음 “다운로드” 버튼을 클릭합니다.

안정적인 확산 저장 다운로드

과거 이미지에 사용된 프롬프트 찾기

몇 개의 이미지를 생성한 후에는 나중에 이미지를 만드는 데 사용되는 프롬프트와 설정을 가져오는 것이 좋습니다.

  • “PNG 정보” 탭을 클릭합니다.
안정적인 확산 Png 정보 드롭 이미지 업로드
  • 상자에 이미지를 업로드합니다. 이미지의 모든 프롬프트 및 기타 세부 정보가 오른쪽에 나타납니다.
안정적인 확산 Png 정보 결과

img2img를 사용하여 유사한 이미지 생성

img2img 기능을 사용하여 기본 이미지의 전체적인 모양을 모방하는 새 이미지를 생성할 수 있습니다.

  • “img2img” 탭에서 동일한 프롬프트로 이전에 생성된 이미지를 사용하고 있는지 확인합니다.
안정적인 확산 Img2img
  • “노이즈 제거 강도” 값을 더 높거나 낮게 설정하여 이미지를 더 많이 또는 더 적게 재생성합니다(0.50은 50% 재생성, 1은 100% 재생성).
안정적인 확산 노이즈 제거 강도 04
  • “생성”을 클릭하고 차이점을 검토합니다. 마음에 들지 않으면 설정을 조정한 후 1~3단계를 반복하십시오.
안정적인 확산 Img2img 1 결과
  • 또는 “img2img로 보내기”를 클릭하여 새 이미지를 기반으로 계속 수정합니다.
안정적인 확산 Img2img로 보내기
  • 프롬프트를 다시 작성하여 이미지에 완전히 새로운 요소를 추가하고 원하는 대로 다른 설정을 조정합니다.
안정적인 확산 Img2img 2개의 새로운 프롬프트
  • “생성”을 클릭하고 결과를 검토합니다.
안정적인 확산 Img2img 2 결과

inpaint를 사용하여 이미지의 일부 변경

인페인트 기능은 마우스를 사용하여 재생성하려는 이미지 부분을 “페인트”하여 기본 이미지에 대한 정확한 부분 수정을 수행할 수 있는 강력한 도구입니다. 페인트하지 않은 부분은 변경되지 않습니다.

  • “img2img 탭 -> Inpaint 탭”에서 이전에 생성된 이미지를 사용하고 있는지 확인합니다.
안정적인 확산 인페인트
  • 새로운 시각적 요소가 필요한 경우 프롬프트를 변경하십시오.
안정적인 확산 인페인트 새 프롬프트
  • 마우스를 사용하여 변경하려는 이미지 부분을 칠하십시오.
마우스로 안정적인 확산 인페인트 그리기
  • “샘플링 방법”을 인페인팅에 권장되는 DDIM으로 변경합니다.
안정적인 확산 Inpaint 샘플링 방법 Ddim
  • 극단적으로 변경하는 경우 더 높은 값을 선택하여 “노이즈 제거 강도”를 설정합니다.
안정적인 확산 인페인트 노이즈 제거 강도 08
  • “생성”을 클릭하고 결과를 검토합니다.
안정적인 확산 인페인트 결과

Stable Diffusion은 첫 번째 시도에서 모든 것을 수정하지 못할 수 있으므로 “Inpaint로 보내기”를 클릭하고 위의 단계를 원하는 만큼 반복할 수 있습니다.

이미지 고급화

지금까지 512 x 512픽셀의 비교적 작은 이미지를 만들었지만 이미지의 해상도를 높이면 시각적 세부 수준도 높아집니다.

Ultimate SD Upscale 확장 프로그램 설치

  • “확장 프로그램 -> 사용 가능 -> 로드”를 클릭합니다.
안정적인 확산 확장 가능 로드 위치
  • 아래로 스크롤하여 “Ultimate SD Upscale 조작”을 찾은 다음 “설치”를 클릭합니다.
안정적인 확산 연장 가능 Ultimate Sd Upscale
  • 위로 스크롤하여 “설치됨” 탭을 클릭합니다. “ultimate-upscale-for-automatic1111″을 선택한 다음 “Apply and restart UI”를 클릭합니다.
안정적인 확산 확장 프로그램 설치 확인 Ultimate Sd Upscale 적용 및 Ui 다시 시작

이미지 크기 조정

  • “img2img” 탭에서 동일한 프롬프트로 이전에 생성된 이미지를 사용하고 있는지 확인합니다. 프롬프트 입력 앞에 “4k”, “UHD”, “고해상도 사진”, “RAW”, “클로즈업”, “피부 모공” 및 “세밀한 눈”과 같은 문구를 추가하여 더 연마하십시오. 부정적인 프롬프트 입력 앞에 “selfie”, “blurry”, “low res” 및 “phone cam”과 같은 문구를 추가하여 이러한 문구를 피하십시오.
안정적인 확산 크기 조정 새 프롬프트
  • “노이즈 제거 강도”를 낮은 값(약 0.25)으로 설정하고 “너비” 및 “높이” 값을 두 배로 설정합니다.
안정적인 확산 크기 조정 너비 높이 노이즈 제거 강도
  • “Script” 드롭다운에서 “Ultimate SD upscale”을 선택한 다음 “Upscaler”에서 “R-ESRGAN 4x+” 옵션을 선택합니다.
안정적인 확산 스크립트 Ultimate Sd Upscaler R Esrgan
  • “생성”을 클릭하고 결과를 검토합니다. 사소한 변경 사항과 더 선명한 세부 정보를 확인할 수 있습니다.
안정적인 확산 크기 조정 결과

“img2img로 보내기”를 클릭하고 “너비” 및 “높이” 값을 더 늘리고 “노이즈 제거 강도”를 조정하는 동안 단계를 반복하여 해상도를 더 높일 수 있습니다.

자주 묻는 질문

Stable Diffusion, DALL-E 및 Midjourney의 차이점은 무엇입니까?

세 가지 모두 텍스트 프롬프트에서 거의 모든 이미지를 생성할 수 있는 AI 프로그램입니다. 가장 큰 차이점은 Stable Diffusion만이 완전히 무료이며 오픈 소스라는 것입니다. 비용을 지불하지 않고 컴퓨터에서 실행할 수 있으며 누구나 Stable Diffusion 코드에서 배우고 개선할 수 있습니다. 하지만 직접 설치해야 한다는 사실 때문에 사용하기가 더 어렵습니다.

DALL-E와 Midjourney는 둘 다 비공개 소스입니다. DALL-E는 주로 웹 사이트를 통해 액세스할 수 있으며 지불을 요청하기 전에 한 달에 제한된 수의 이미지 생성을 제공합니다. Midjourney는 주로 Discord 서버 의 명령을 통해 액세스할 수 있으며 구독 계층이 다릅니다.

Stable Diffusion에서 모델이란 무엇입니까?

모델은 특정 이미지와 키워드에 대해 훈련된 AI 알고리즘을 나타내는 파일입니다. 다른 모델은 다른 유형의 이미지를 만드는 데 더 좋습니다. 사실적인 사람을 만드는 데 좋은 모델, 2D 만화 캐릭터를 만드는 데 좋은 모델, 풍경화를 만드는 데 가장 적합한 모델이 있을 수 있습니다.

이 가이드에서 설치한 Deliberate 모델은 대부분의 이미지에 좋은 인기 모델이지만 Civitai 또는 Hugging Face 와 같은 웹 사이트에서 모든 종류의 모델을 확인할 수 있습니다 . 당신이 다운로드하는 한. safetensors 파일을 사용하려면 이 가이드의 동일한 지침을 사용하여 AUTOMATIC1111 웹 UI로 가져올 수 있습니다.

SafeTensor와 PickleTensor의 차이점은 무엇입니까?

요컨대 항상 SafeTensor를 사용하여 보안 위협으로부터 컴퓨터를 보호하십시오.

SafeTensor와 PickleTensor는 둘 다 Stable Diffusion을 위한 모델을 저장하는 데 사용되는 파일 형식이지만 PickleTensor는 더 오래되고 덜 안전한 형식입니다. PickleTensor 모델은 시스템에서 임의 코드(맬웨어 포함)를 실행할 수 있습니다.

배치 크기 또는 배치 수 설정을 사용해야 합니까?

둘 다 사용할 수 있습니다. 배치는 병렬로 생성되는 이미지 그룹입니다. 배치 크기 설정은 단일 배치에 있는 이미지 수를 제어합니다. 일괄 처리 수 설정은 단일 생성에서 실행되는 일괄 처리 수를 제어합니다. 각 배치는 순차적으로 실행됩니다.

배치 수가 2이고 배치 크기가 4인 경우 배치 2개와 총 8개의 이미지를 생성합니다.

직접 그리는 것을 선호한다면 Windows용 스케치 앱 목록을 확인하세요.

이미지 크레디트: 픽사베이 . Brandon Li의 모든 스크린샷.

  • 페이스북
  • 트위터

답글 남기기

이메일 주소는 공개되지 않습니다. 필수 필드는 *로 표시됩니다