안정적인 확산을 사용하여 AI 생성 이미지를 생성하는 방법

2023/04/07

ChatGPT와 같은 인공 지능 챗봇은 최근 엄청나게 강력해졌습니다. 그러나 AI 이미지 생성기(예: Stable Diffusion, DALL-E 및 Midjourney)를 잊지 마십시오. 몇 단어만 제공되면 거의 모든 이미지를 만들 수 있습니다. 컴퓨터에서 Stable Diffusion을 실행하여 제한 없이 무료로 이 작업을 수행하는 방법을 배우려면 이 튜토리얼을 따르십시오.

안정적인 확산이란 무엇입니까?

Stable Diffusion은 무료 오픈 소스 텍스트-이미지 기계 학습 모델입니다. 기본적으로 텍스트를 사용하여 그림을 설명하고 이미지를 생성할 수 있는 프로그램입니다. 수십억 개의 이미지와 함께 제공되는 텍스트 설명이 제공되었으며 이를 분석하고 재구성하는 방법을 배웠습니다.

Stable Diffusion은 직접 사용하는 프로그램이 아닙니다. 다른 프로그램에서 사용하는 기본 소프트웨어 도구라고 생각하면 됩니다. 이 튜토리얼은 컴퓨터에 Stable Diffusion 프로그램을 설치하는 방법을 보여줍니다. Stable Diffusion을 사용하는 많은 프로그램과 웹사이트가 있지만 많은 프로그램과 웹사이트에서 비용을 청구하고 제어할 수 없습니다.

시스템 요구 사항

목표로 삼아야 할 대략적인 지침은 다음과 같습니다.

macOS: Apple Silicon(M 시리즈 칩)

Windows 또는 Linux: NVIDIA 또는 AMD GPU
RAM: 최상의 결과를 위한 16GB
GPU VRAM: 최소 4GB
저장 공간: 최소 15GB

AUTOMATIC1111 웹 UI 설치

우리는 모든 주요 데스크톱 운영 체제에서 사용할 수 있는 AUTOMATIC1111 웹 UI 프로그램을 사용하여 Stable Diffusion에 액세스하고 있습니다. “stable-diffiusion-webui” 디렉토리가 다운로드되는 위치를 기록해 두십시오.

macOS의 AUTOMATIC1111 웹 UI

터미널에서 다음 명령을 입력하여 Homebrew를 설치합니다.

/bin/bash -c "$(curl -fsSL https://raw.githubusercontent.com/Homebrew/install/HEAD/install.sh)"

Homebrew를 PATH에 추가하기 위한 두 명령을 복사하고 입력합니다.

터미널을 종료했다가 다시 열고 다음을 입력하십시오.

brew install cmake protobuf rust python@3.10 git wget

입력하다:

git clone https://github.com/AUTOMATIC1111/stable-diffusion-webui

Windows의 AUTOMATIC1111 웹 UI

Python 3.10의 최신 안정 버전을 다운로드합니다 .

Stable Diffusion Windows Python 웹 사이트 Stable 릴리스 3 10 1

Python 설치 프로그램을 실행하고 “Add python.exe to PATH”를 선택한 다음 “지금 설치”를 클릭합니다.

GitHub의 AUTOMATIC1111 웹 UI 리포지토리 로 이동하여 “코드”를 클릭한 다음 “ZIP 다운로드”를 클릭하고 압축을 풉니다.

Linux의 AUTOMATIC1111 웹 UI

터미널을 엽니다.

Linux의 특성에 따라 다음 명령 중 하나를 입력하십시오.

Ubuntu를 포함한 Debian 기반:

sudo apt-get updatesudo apt install wget git python3 python3-ven

Red Hat 기반:

sudo dnf install wget git python3

아치 기반:

sudo pacman -S wget git python3

다음 명령을 실행하여 “/home/$(whoami)/stable-diffusion-webui/”에 설치합니다.

bash <(wget -qO- https://raw.githubusercontent.com/AUTOMATIC1111/stable-diffusion-webui/master/webui.sh)

모델 설치

웹 UI를 사용하기 전에 최소한 하나의 모델을 추가해야 합니다.

시비타이 로 이동합니다 .
다운로드 버튼의 드롭다운 화살표를 클릭하고 “Model SafeTensor”를 선택합니다.

안정적인 확산 Civit Ai 고의적 다운로드 모델 Safetensor 1

이동합니다. 2단계에서 “stable-diffiusion-webui/models/Stable-diffusion” 폴더에 다운로드한 safetensors 파일.

웹 UI 실행 및 구성

이제 웹 브라우저에서 Stable Diffusion 프로그램을 실행하고 시작할 준비가 되었습니다.

터미널에서 “stable-diffusion-webui” 디렉토리를 열고 ./webui.sh --xformersLinux/macOS 또는 ./webui-user.batWindows용 명령을 입력합니다. 완료되면 http://127.0.0.1:7860과 같은 “로컬 URL에서 실행” 옆의 URL을 선택하여 복사합니다.

브라우저 주소 표시줄에 링크를 붙여넣고 를 누르십시오 Enter. 웹 UI 웹사이트가 나타납니다.

더 나은 결과를 위해 몇 가지 설정을 변경해 보겠습니다. “설정 -> 안정적인 확산”으로 이동합니다.

아래로 스크롤하여 “더 선명하고 깨끗한 결과를 위해 K 샘플러에서 양자화 활성화”를 선택합니다.

위로 스크롤하여 ‘설정 적용’을 클릭한 다음 ‘UI 다시 로드’를 클릭합니다.

FYI: 이미지 소스를 찾아야 하는 경우 Google을 사용하십시오.

txt2txt를 사용하여 개념 이미지 생성

이제 재미있는 부분이 있습니다. 초기 이미지를 만들고 원하는 모양과 가장 유사한 이미지를 검색합니다.

“txt2img” 탭으로 이동합니다.
첫 번째 프롬프트 텍스트 상자에 이미지를 설명하는 단어를 쉼표로 구분하여 입력합니다. “현실적”, “자세한” 또는 “클로즈업 초상화”와 같은 이미지 스타일을 설명하는 단어를 포함하는 데 도움이 됩니다.

아래의 제외 프롬프트 텍스트 상자에 이미지를 표시하고 싶지 않은 키워드를 입력하십시오. 예를 들어 사실적인 이미지를 만들려는 경우 ‘비디오 게임’, ‘예술’, ‘일러스트’와 같은 단어를 추가하세요.

아래로 스크롤하여 “배치 크기”를 “4”로 설정합니다. 이렇게 하면 Stable Diffusion이 프롬프트에서 4개의 다른 이미지를 생성합니다.

Stable Diffusion이 프롬프트 키워드를 더 엄격하게 따르도록 하려면 “CFG 척도”를 더 높게 설정하고 더 창의적으로 하려면 더 낮은 값으로 설정하십시오. 낮은 값(예: 기본값 7)은 일반적으로 품질이 좋고 독창적인 이미지를 생성합니다.

지금은 다른 설정을 기본값으로 둡니다. Stable Diffusion 작업을 시작하려면 상단의 큰 “Generate” 버튼을 클릭하십시오.

“생성” 버튼 아래에서 이미지 축소판을 클릭하여 미리 보고 마음에 드는지 결정합니다.

이미지가 마음에 들지 않으면 약간 변형하여 1~5단계를 반복합니다.

전체적으로 하나의 이미지가 마음에 들지만 수정하거나 문제(왜곡된 얼굴, 해부학적 문제 등)를 수정하려면 “img2img로 보내기” 또는 “inpaint로 보내기”를 클릭하십시오. 이렇게 하면 이미지가 복사되고 이미지를 개선할 수 있는 해당 탭으로 프롬프트가 표시됩니다.

이미지가 매우 흥미롭거나 좋은 경우 “저장” 버튼을 클릭한 다음 “다운로드” 버튼을 클릭합니다.

과거 이미지에 사용된 프롬프트 찾기

몇 개의 이미지를 생성한 후에는 나중에 이미지를 만드는 데 사용되는 프롬프트와 설정을 가져오는 것이 좋습니다.

“PNG 정보” 탭을 클릭합니다.

상자에 이미지를 업로드합니다. 이미지의 모든 프롬프트 및 기타 세부 정보가 오른쪽에 나타납니다.

img2img를 사용하여 유사한 이미지 생성

img2img 기능을 사용하여 기본 이미지의 전체적인 모양을 모방하는 새 이미지를 생성할 수 있습니다.

“img2img” 탭에서 동일한 프롬프트로 이전에 생성된 이미지를 사용하고 있는지 확인합니다.

“노이즈 제거 강도” 값을 더 높거나 낮게 설정하여 이미지를 더 많이 또는 더 적게 재생성합니다(0.50은 50% 재생성, 1은 100% 재생성).

“생성”을 클릭하고 차이점을 검토합니다. 마음에 들지 않으면 설정을 조정한 후 1~3단계를 반복하십시오.

또는 “img2img로 보내기”를 클릭하여 새 이미지를 기반으로 계속 수정합니다.

프롬프트를 다시 작성하여 이미지에 완전히 새로운 요소를 추가하고 원하는 대로 다른 설정을 조정합니다.

“생성”을 클릭하고 결과를 검토합니다.

inpaint를 사용하여 이미지의 일부 변경

인페인트 기능은 마우스를 사용하여 재생성하려는 이미지 부분을 “페인트”하여 기본 이미지에 대한 정확한 부분 수정을 수행할 수 있는 강력한 도구입니다. 페인트하지 않은 부분은 변경되지 않습니다.

“img2img 탭 -> Inpaint 탭”에서 이전에 생성된 이미지를 사용하고 있는지 확인합니다.

새로운 시각적 요소가 필요한 경우 프롬프트를 변경하십시오.

마우스를 사용하여 변경하려는 이미지 부분을 칠하십시오.

“샘플링 방법”을 인페인팅에 권장되는 DDIM으로 변경합니다.

극단적으로 변경하는 경우 더 높은 값을 선택하여 “노이즈 제거 강도”를 설정합니다.

“생성”을 클릭하고 결과를 검토합니다.

Stable Diffusion은 첫 번째 시도에서 모든 것을 수정하지 못할 수 있으므로 “Inpaint로 보내기”를 클릭하고 위의 단계를 원하는 만큼 반복할 수 있습니다.

이미지 고급화

지금까지 512 x 512픽셀의 비교적 작은 이미지를 만들었지만 이미지의 해상도를 높이면 시각적 세부 수준도 높아집니다.

Ultimate SD Upscale 확장 프로그램 설치

“확장 프로그램 -> 사용 가능 -> 로드”를 클릭합니다.

아래로 스크롤하여 “Ultimate SD Upscale 조작”을 찾은 다음 “설치”를 클릭합니다.

위로 스크롤하여 “설치됨” 탭을 클릭합니다. “ultimate-upscale-for-automatic1111″을 선택한 다음 “Apply and restart UI”를 클릭합니다.

안정적인 확산 확장 프로그램 설치 확인 Ultimate Sd Upscale 적용 및 Ui 다시 시작

이미지 크기 조정

“img2img” 탭에서 동일한 프롬프트로 이전에 생성된 이미지를 사용하고 있는지 확인합니다. 프롬프트 입력 앞에 “4k”, “UHD”, “고해상도 사진”, “RAW”, “클로즈업”, “피부 모공” 및 “세밀한 눈”과 같은 문구를 추가하여 더 연마하십시오. 부정적인 프롬프트 입력 앞에 “selfie”, “blurry”, “low res” 및 “phone cam”과 같은 문구를 추가하여 이러한 문구를 피하십시오.

“노이즈 제거 강도”를 낮은 값(약 0.25)으로 설정하고 “너비” 및 “높이” 값을 두 배로 설정합니다.

“Script” 드롭다운에서 “Ultimate SD upscale”을 선택한 다음 “Upscaler”에서 “R-ESRGAN 4x+” 옵션을 선택합니다.

안정적인 확산 스크립트 Ultimate Sd Upscaler R Esrgan

“생성”을 클릭하고 결과를 검토합니다. 사소한 변경 사항과 더 선명한 세부 정보를 확인할 수 있습니다.

“img2img로 보내기”를 클릭하고 “너비” 및 “높이” 값을 더 늘리고 “노이즈 제거 강도”를 조정하는 동안 단계를 반복하여 해상도를 더 높일 수 있습니다.

자주 묻는 질문

Stable Diffusion, DALL-E 및 Midjourney의 차이점은 무엇입니까?

세 가지 모두 텍스트 프롬프트에서 거의 모든 이미지를 생성할 수 있는 AI 프로그램입니다. 가장 큰 차이점은 Stable Diffusion만이 완전히 무료이며 오픈 소스라는 것입니다. 비용을 지불하지 않고 컴퓨터에서 실행할 수 있으며 누구나 Stable Diffusion 코드에서 배우고 개선할 수 있습니다. 하지만 직접 설치해야 한다는 사실 때문에 사용하기가 더 어렵습니다.

DALL-E와 Midjourney는 둘 다 비공개 소스입니다. DALL-E는 주로 웹 사이트를 통해 액세스할 수 있으며 지불을 요청하기 전에 한 달에 제한된 수의 이미지 생성을 제공합니다. Midjourney는 주로 Discord 서버 의 명령을 통해 액세스할 수 있으며 구독 계층이 다릅니다.

Stable Diffusion에서 모델이란 무엇입니까?

모델은 특정 이미지와 키워드에 대해 훈련된 AI 알고리즘을 나타내는 파일입니다. 다른 모델은 다른 유형의 이미지를 만드는 데 더 좋습니다. 사실적인 사람을 만드는 데 좋은 모델, 2D 만화 캐릭터를 만드는 데 좋은 모델, 풍경화를 만드는 데 가장 적합한 모델이 있을 수 있습니다.

이 가이드에서 설치한 Deliberate 모델은 대부분의 이미지에 좋은 인기 모델이지만 Civitai 또는 Hugging Face 와 같은 웹 사이트에서 모든 종류의 모델을 확인할 수 있습니다 . 당신이 다운로드하는 한. safetensors 파일을 사용하려면 이 가이드의 동일한 지침을 사용하여 AUTOMATIC1111 웹 UI로 가져올 수 있습니다.

SafeTensor와 PickleTensor의 차이점은 무엇입니까?

요컨대 항상 SafeTensor를 사용하여 보안 위협으로부터 컴퓨터를 보호하십시오.

SafeTensor와 PickleTensor는 둘 다 Stable Diffusion을 위한 모델을 저장하는 데 사용되는 파일 형식이지만 PickleTensor는 더 오래되고 덜 안전한 형식입니다. PickleTensor 모델은 시스템에서 임의 코드(맬웨어 포함)를 실행할 수 있습니다.

배치 크기 또는 배치 수 설정을 사용해야 합니까?

둘 다 사용할 수 있습니다. 배치는 병렬로 생성되는 이미지 그룹입니다. 배치 크기 설정은 단일 배치에 있는 이미지 수를 제어합니다. 일괄 처리 수 설정은 단일 생성에서 실행되는 일괄 처리 수를 제어합니다. 각 배치는 순차적으로 실행됩니다.

배치 수가 2이고 배치 크기가 4인 경우 배치 2개와 총 8개의 이미지를 생성합니다.

직접 그리는 것을 선호한다면 Windows용 스케치 앱 목록을 확인하세요.

이미지 크레디트: 픽사베이 . Brandon Li의 모든 스크린샷.

페이스북
트위터