Come utilizzare la diffusione stabile per creare immagini generate dall’intelligenza artificiale

Come utilizzare la diffusione stabile per creare immagini generate dall’intelligenza artificiale

I chatbot di intelligenza artificiale, come ChatGPT, sono diventati incredibilmente potenti di recente: sono ovunque nelle notizie! Ma non dimenticare i generatori di immagini AI (come Stable Diffusion, DALL-E e Midjourney). Possono creare praticamente qualsiasi immagine se fornite solo di poche parole. Segui questo tutorial per imparare come farlo gratuitamente senza restrizioni eseguendo Stable Diffusion sul tuo computer.

Cos’è la diffusione stabile?

Stable Diffusion è un modello di apprendimento automatico da testo a immagine gratuito e open source. Fondamentalmente, è un programma che ti consente di descrivere un’immagine utilizzando il testo, quindi crea l’immagine per te. Ha ricevuto miliardi di immagini e descrizioni testuali di accompagnamento e gli è stato insegnato ad analizzarle e ricostruirle.

Stable Diffusion non è il programma che usi direttamente: pensalo più come lo strumento software sottostante utilizzato da altri programmi. Questo tutorial mostra come installare un programma Stable Diffusion sul tuo computer. Tieni presente che ci sono molti programmi e siti Web che utilizzano Stable Diffusion, ma molti ti addebiteranno denaro e non ti daranno lo stesso controllo.

Requisiti di sistema

Le linee guida approssimative su ciò a cui dovresti mirare sono le seguenti:

  • macOS: Apple Silicon (un chip della serie M)
  • Windows o Linux: GPU NVIDIA o AMD
  • RAM: 16 GB per i migliori risultati
  • GPU VRAM: almeno 4 GB
  • Memoria: almeno 15 GB

Installa l’interfaccia utente Web AUTOMATIC1111

Stiamo utilizzando il programma UI Web AUTOMATIC1111 , disponibile su tutti i principali sistemi operativi desktop, per accedere a Stable Diffusion. Assicurati di prendere nota di dove viene scaricata la directory “stable-diffiusion-webui”.

Interfaccia utente Web AUTOMATIC1111 su macOS

  • In Terminal, installa Homebrew immettendo il comando:

/bin/bash -c "$(curl -fsSL https://raw.githubusercontent.com/Homebrew/install/HEAD/install.sh)"

Diffusione stabile Macos Installa Homebrew
  • Copia i due comandi per aggiungere Homebrew al tuo PERCORSO e inseriscili.
Macos a diffusione stabile aggiungono homebrew al percorso
  • Esci e riapri Terminal, quindi inserisci:

brew install cmake protobuf rust python@3.10 git wget

Dipendenze di installazione di Macos Brew a diffusione stabile
  • Accedere:

git clone https://github.com/AUTOMATIC1111/stable-diffusion-webui

Diffusione stabile Macos Git Clone Web Ui

Interfaccia utente Web AUTOMATICA 1111 su Windows

Diffusione stabile Sito Web Windows Python Versione stabile 3 10 1
  • Esegui il programma di installazione di Python, seleziona “Aggiungi python.exe a PATH” e fai clic su “Installa ora”.
Diffusione stabile Windows Installa Python 3 Aggiungi al percorso
Download del codice Github per Windows a diffusione stabile

Interfaccia utente Web AUTOMATICA 1111 su Linux

  • Apri il Terminale.
Terminale aperto Linux a diffusione stabile
  • Inserisci uno dei seguenti comandi, a seconda del tuo gusto di Linux:

Basato su Debian, incluso Ubuntu:

sudo apt-get updatesudo apt install wget git python3 python3-ven

Basato su Red Hat:

sudo dnf install wget git python3

Basato sull’arco:

sudo pacman -S wget git python3

  • Installa in “/home/$(whoami)/stable-diffusion-webui/” eseguendo questo comando:

bash <(wget -qO- https://raw.githubusercontent.com/AUTOMATIC1111/stable-diffusion-webui/master/webui.sh)

Stable Diffusion Linux Installa l'interfaccia utente Web

Installa un modello

Dovrai comunque aggiungere almeno un modello prima di poter iniziare a utilizzare l’interfaccia utente Web.

  • Vai a CIVITAI .
  • Fare clic sulla freccia del menu a discesa sul pulsante di download e selezionare “Model SafeTensor”.
Diffusione Stabile Civit Ai Deliberato Scarica Modello Safetensor 1
  • Muovi il. file safetensors scaricato nel passaggio 2 nella cartella “stable-diffiusion-webui/models/Stable-diffusion”.
Diffusione stabile Sposta nella cartella dei modelli Webui 1

Eseguire e configurare l’interfaccia utente Web

A questo punto, sei pronto per eseguire e iniziare a utilizzare il programma Stable Diffusion nel tuo browser web.

  • Nel tuo terminale, apri la tua directory “stable-diffusion-webui” e inserisci il comando ./webui.sh --xformersper Linux / macOS o ./webui-user.batper Windows. Al termine, seleziona e copia l’URL accanto a “In esecuzione su URL locale”, che dovrebbe essere simile a http://127.0.0.1:7860.
Diffusione stabile Webui Xformers URL locale
  • Incolla il link nella barra degli indirizzi del browser e premi Enter. Verrà visualizzato il sito Web dell’interfaccia utente Web.
Browser del sito web Webui a diffusione stabile
  • Cambiamo alcune impostazioni per ottenere risultati migliori. Vai su “Impostazioni -> Diffusione stabile”.
Impostazioni diffusione stabile Diffusione stabile
  • Scorri verso il basso e seleziona “Abilita la quantizzazione nei campionatori K per risultati più nitidi e puliti”.
Impostazioni di diffusione stabile Quantizzazione K Campionatori Più nitido Pulitore
  • Scorri verso l’alto e fai clic su “Applica impostazioni”, quindi su “Ricarica interfaccia utente”.
Impostazioni diffusione stabile Applica impostazioni Ricarica interfaccia utente

Cordiali saluti: se hai bisogno di trovare una fonte di immagini, usa Google.

Usa txt2txt per generare immagini concettuali

Ora arriva la parte divertente: creare alcune immagini iniziali e cercarne una che assomigli di più all’aspetto che desideri.

  • Vai alla scheda “txt2img”.
  • Nella prima casella di testo del prompt, digita le parole che descrivono la tua immagine separate da virgole. È utile includere parole che descrivano lo stile dell’immagine, come “realistico”, “dettagliato” o “ritratto ravvicinato”.
Diffusione stabile Txt2img Prompt
  • Nella casella di testo del prompt negativo in basso, digita le parole chiave che non desideri che assomiglino alla tua immagine. Ad esempio, se stai cercando di creare immagini realistiche, aggiungi parole come “videogioco”, “arte” e “illustrazione”.
Diffusione stabile Txt2img Prompt negativo
  • Scorri verso il basso e imposta “Dimensione batch” su “4”. Ciò farà sì che Stable Diffusion produca quattro immagini diverse dal tuo prompt.
Dimensione del lotto a diffusione stabile 4
  • Rendi la “Scala CFG” un valore più alto se vuoi che Stable Diffusion segua le parole chiave richieste in modo più rigoroso o un valore più basso se vuoi che sia più creativo. Un valore basso (come il valore predefinito di 7) di solito produce immagini di buona qualità e creative.
Scala Cfg di diffusione stabile
  • Lascia le altre impostazioni ai loro valori predefiniti per ora. Fai clic sul grande pulsante “Genera” in alto per Stable Diffusion per iniziare a lavorare.
Diffusione stabile Txt2img Pulsante Genera 1
  • Sotto il pulsante “Genera”, fai clic sulle miniature delle immagini per visualizzarle in anteprima e determinare se ti piace qualcuna di esse.
Risultato diffusione stabile Txt2img

Se nessuna delle immagini ti piace, ripeti i passaggi da 1 a 5 con leggere variazioni.

Se ti piace un’immagine in generale ma desideri modificarla o risolvere problemi (una faccia distorta, problemi anatomici, ecc.), fai clic su “Invia a img2img” o “Invia a inpaint”. Questo copierà la tua immagine e le richieste nelle rispettive schede in cui puoi migliorare l’immagine.

Diffusione stabile Invia a Img2img

Se un’immagine è eccezionalmente interessante o buona, fai clic sul pulsante “Salva” seguito dal pulsante “Scarica”.

Diffusione stabile Salva Download

Trovare i prompt utilizzati per le immagini precedenti

Dopo aver generato alcune immagini, è utile ottenere i prompt e le impostazioni utilizzate per creare un’immagine dopo il fatto.

  • Fai clic sulla scheda “Informazioni PNG”.
Diffusione stabile Png Info Rilascia caricamento immagine
  • Carica un’immagine nella casella. Tutti i prompt e altri dettagli della tua immagine appariranno sulla destra.
Risultati delle informazioni Png a diffusione stabile

Usa img2img per generare immagini simili

Puoi utilizzare la funzione img2img per generare nuove immagini che imitano l’aspetto generale di qualsiasi immagine di base.

  • Nella scheda “img2img”, assicurati di utilizzare un’immagine generata in precedenza con gli stessi prompt.
Diffusione stabile Img2img
  • Imposta il valore “Denoising strength” su un valore più alto o più basso per rigenerare più o meno la tua immagine (0,50 rigenera il 50% e 1 rigenera il 100%).
Forza di riduzione del rumore a diffusione stabile 04
  • Fare clic su “Genera” e rivedere le differenze. Se non sei soddisfatto, ripeti i passaggi da 1 a 3 dopo aver modificato le impostazioni.
Diffusione Stabile Img2img 1 Risultato
  • In alternativa, fai clic su “Invia a img2img” per continuare ad apportare modifiche in base alla nuova immagine.
Diffusione stabile Invia a Img2img
  • Riscrivi le istruzioni per aggiungere elementi completamente nuovi all’immagine e regola altre impostazioni come desiderato.
Diffusione stabile Img2img 2 Nuovi messaggi
  • Fare clic su “Genera” e rivedere il risultato.
Diffusione stabile Img2img 2 Risultato

Usa inpaint per cambiare parte di un’immagine

La funzione Inpaint è un potente strumento che consente di apportare correzioni puntuali precise a un’immagine di base utilizzando il mouse per “dipingere” su parti di un’immagine che si desidera rigenerare. Le parti che non hai dipinto non vengono modificate.

  • Nella “scheda img2img -> scheda Inpaint”, assicurati di utilizzare un’immagine generata in precedenza.
Diffusione stabile Inpaint
  • Cambia i tuoi prompt se desideri nuovi elementi visivi.
Diffusione stabile Inpaint Nuovi prompt
  • Usa il mouse per dipingere sulla parte dell’immagine che desideri modificare.
Diffusione stabile Inpaint Disegna con il mouse
  • Cambia il “Metodo di campionamento” in DDIM, che è consigliato per l’inpainting.
Diffusione stabile Inpaint Metodo di campionamento Ddim
  • Imposta la “Forza di denoising”, scegliendo un valore più alto se stai apportando modifiche estreme.
Diffusione stabile Inpaint Denoising Strength 08
  • Fare clic su “Genera” e rivedere il risultato.
Risultato Inpaint a diffusione stabile

Stable Diffusion probabilmente non risolverà tutto al primo tentativo, quindi puoi fare clic su “Invia a inpaint” e ripetere i passaggi precedenti tutte le volte che vuoi.

Migliora la tua immagine

Fino a questo punto hai creato immagini relativamente piccole a 512 x 512 pixel, ma se aumenti la risoluzione dell’immagine, aumenta anche il livello di dettaglio visivo.

Installa l’estensione Ultimate SD Upscale

  • Fai clic su “Estensioni -> Disponibile -> Carica da”.
Diffusione stabile Prolunghe disponibili Carico da
  • Scorri verso il basso per trovare “Ultimate manipolazioni SD Upscale” e fai clic su “Installa”.
Estensioni di diffusione stabile disponibili Ultimate Sd Upscale
  • Scorri verso l’alto e fai clic sulla scheda “Installato”. Seleziona “ultimate-upscale-for-automatic1111”, quindi fai clic su “Applica e riavvia l’interfaccia utente”.
Estensioni di diffusione stabile installate Controlla Ultimate Sd Upscale Applica e riavvia l'interfaccia utente

Ridimensiona la tua immagine

  • Nella scheda “img2img”, assicurati di utilizzare un’immagine generata in precedenza con gli stessi prompt. Nella parte anteriore del tuo prompt di input, aggiungi frasi come “4k”, “UHD”, “foto ad alta risoluzione”, “RAW”, “primo piano”, “pori della pelle” e “occhi dettagliati” per perfezionare ulteriormente. Nella parte anteriore dell’input di prompt negativo, aggiungi frasi come “selfie”, “sfocato”, “bassa risoluzione” e “videocamera del telefono” per allontanarti da quelli.
Diffusione stabile Ridimensiona nuovi prompt
  • Imposta la tua “Forza di riduzione del rumore” su un valore basso (circa 0,25) e raddoppia i valori di “Larghezza” e “Altezza”.
Diffusione stabile Ridimensiona Larghezza Altezza Forza di riduzione del rumore
  • Nel menu a discesa “Script”, seleziona “Ultimate SD upscale”, quindi in “Upscaler”, seleziona l’opzione “R-ESRGAN 4x+”.
Stable Diffusion Script Ultimate Sd Upscaler R Esrgan
  • Fare clic su “Genera” e rivedere il risultato. Dovresti notare piccoli cambiamenti e dettagli più nitidi.
Risultato ridimensionamento diffusione stabile

Puoi aumentare ulteriormente la risoluzione facendo clic su “Invia a img2img” e ripetendo i passaggi aumentando ulteriormente i valori “Larghezza” e “Altezza” e modificando la “Forza di riduzione del rumore”.

Domande frequenti

Qual è la differenza tra diffusione stabile, DALL-E e Midjourney?

Tutti e tre sono programmi di intelligenza artificiale in grado di creare quasi tutte le immagini da un prompt di testo. La più grande differenza è che solo Stable Diffusion è completamente gratuito e open source. Puoi eseguirlo sul tuo computer senza pagare nulla e chiunque può imparare e migliorare il codice di Stable Diffusion. Tuttavia, il fatto che sia necessario installarlo da soli ne rende più difficile l’utilizzo.

DALL-E e Midjourney sono entrambi closed source. DALL-E è accessibile principalmente tramite il suo sito Web e offre un numero limitato di generazioni di immagini al mese prima di chiederti di pagare. È possibile accedere a Midjourney principalmente tramite i comandi sul suo server Discord e ha diversi livelli di abbonamento.

Cos’è un modello in Diffusione Stabile?

Un modello è un file che rappresenta un algoritmo AI addestrato su immagini e parole chiave specifiche. Diversi modelli sono migliori nella creazione di diversi tipi di immagini: potresti avere un modello bravo a creare persone realistiche, un altro bravo a creare personaggi dei cartoni animati 2D e un altro ancora che è il migliore per creare dipinti di paesaggi.

Il modello Deliberate che abbiamo installato in questa guida è un modello popolare che va bene per la maggior parte delle immagini, ma puoi dare un’occhiata a tutti i tipi di modelli su siti web come Civitai o Hugging Face . Finché scarichi un file . safetensors, puoi importarlo nell’interfaccia utente Web AUTOMATIC1111 utilizzando le stesse istruzioni in questa guida.

Qual è la differenza tra SafeTensor e PickleTensor?

In breve, usa sempre SafeTensor per proteggere il tuo computer dalle minacce alla sicurezza.

Mentre sia SafeTensor che PickleTensor sono formati di file utilizzati per archiviare modelli per Stable Diffusion, PickleTensor è il formato più vecchio e meno sicuro. Un modello PickleTensor può eseguire codice arbitrario (incluso malware) sul tuo sistema.

Devo utilizzare la dimensione del batch o l’impostazione del conteggio del batch?

Puoi usare entrambi. Un batch è un gruppo di immagini che vengono generate in parallelo. L’impostazione della dimensione del batch controlla quante immagini ci sono in un singolo batch. L’impostazione del conteggio batch controlla quanti batch vengono eseguiti in una singola generazione; ogni batch viene eseguito in sequenza.

Se hai un conteggio batch pari a 2 e una dimensione batch pari a 4, genererai due batch e un totale di otto immagini.

Se preferisci disegnare le cose da solo, dai un’occhiata al nostro elenco di app di sketch per Windows.

Credito immagine: Pixabay . Tutti gli screenshot di Brandon Li.

  • Facebook
  • Twitta

Lascia un commento

Il tuo indirizzo email non sarà pubblicato. I campi obbligatori sono contrassegnati *