Melhores técnicas gratuitas para gerar imagens de IA com difusão estável

Notas principais

O Stable Diffusion é de código aberto e permite a geração de imagens locais.
Existem vários métodos para seu uso, cada um adaptado a diferentes níveis de usuários.
As especificações do sistema otimizam o desempenho, especialmente os requisitos de GPU.

Aproveitando o poder da difusão estável para geração de imagens de IA

Imagine criar visuais impressionantes alimentados por IA diretamente do conforto da sua casa. Ao contrário de geradores online limitados, o Stable Diffusion é uma ferramenta poderosa de código aberto que permite essa liberdade. Neste guia, exploraremos três métodos distintos para utilizar o Stable Diffusion para gerar imagens de IA autênticas.

O que é difusão estável?

O Stable Diffusion serve como uma estrutura fundamental que transforma prompts de texto em imagens detalhadas. Embora não seja um aplicativo tradicional por si só, ele fundamenta vários aplicativos, oferecendo aos usuários um método de primeira linha para produção de imagens de IA generativa. Este guia enfatiza estratégias adequadas para todos os níveis de habilidade — métodos amigáveis para iniciantes juntamente com técnicas avançadas.

Requisitos essenciais do sistema

Para garantir uma experiência ideal ao usar o Stable Diffusion, considere as seguintes especificações do sistema:

macOS: Apple Silicon (chip série M)
Windows ou Linux: GPU NVIDIA ou AMD
RAM: Mínimo de 16 GB recomendado para eficiência.
VRAM da GPU: pelo menos 4 GB (8 GB é o ideal).
Armazenamento: requer cerca de 60-70 GB de espaço disponível em disco.

1. Usando o WebUI Automatic1111

O primeiro método permite que você aproveite a interface de usuário da Web AUTOMATIC1111 para acesso contínuo ao Stable Diffusion, compatível com vários sistemas operacionais.

Comece baixando a versão mais recente do Python. Após a instalação, certifique-se de selecionar a opção Add python.exe to PATH durante a configuração.

Etapa 1: instalar um modelo

Antes de usar a Web UI, você deve instalar pelo menos um modelo, que serve como base artística para suas saídas de imagem. Escolha um modelo do CIVITAI que ressoe com sua visão.

Depois de selecionar seu modelo, baixe o arquivo de ponto de verificação ‘.safetensors’ correspondente e coloque-o no diretório correto dentro do caminho de instalação do Automatic1111 WebUI.

Etapa 2: executar e configurar o WebUI

Com seu modelo pronto, abra o terminal para macOS e navegue até sua pasta “stable-diffusion-webui”, então execute o comando ./webui.sh --xformers. Usuários do Windows devem executar ./webui-user.bat. Isso fornecerá uma URL, normalmente http://127.0.0.1:7860, para acesso local.

Insira essa URL no seu navegador e você encontrará a Web UI hospedada localmente. Embora sua interface possa parecer assustadora, a maioria das configurações pode permanecer intocada no início. Ajuste os parâmetros Width e Height e estabeleça o tamanho do lote para 4, permitindo quatro imagens exclusivas com cada prompt.

Insira um prompt criativo na aba txt2img, detalhando seus atributos desejados para a imagem — seja específico e use vírgulas para separar ideias. Defina o estilo artístico por meio de palavras-chave como ‘realista’ ou ‘detalhado’.

Ao especificar prompts negativos, inclua elementos que você deseja excluir da imagem final. Clique em Gerar para iniciar o processo. Você pode revisar e refinar suas saídas com base nas miniaturas geradas.

2. Explorando o Fooocus: o gerador de imagens de IA mais fácil

Como uma alternativa intuitiva, o Fooocus se destaca pela sua interface amigável, o que o torna ideal para quem é novo na geração de imagens de IA.

Para começar, baixe o arquivo Fooocus compactado e extraia seu conteúdo. Então, selecione um checkpoint do CIVITAI, navegue até sua pasta Fooocus e siga até models -> checkpoints para colocar o arquivo.

Etapa 1: Executando o Fooocus

Inicie o Fooocus clicando duas vezes em run.bat, que abre a interface no seu navegador da web. Habilite a opção Advanced settings para mais opções de configuração.

Ajuste sua proporção de aspecto e especifique a contagem de imagens por prompt. Defina o desempenho como Velocidade para taxas de geração ideais e insira quaisquer prompts negativos para filtrar elementos indesejados das imagens.

Etapa 2: Utilizando o AI Face Swap no Fooocus

O Fooocus também fornece um recurso FaceSwap, permitindo que o rosto de uma imagem seja substituído por outro. Certifique-se de ativar as opções Input Image e Image Prompt para carregar a imagem relevante.

Após marcar a área do rosto, prossiga para ajustar as configurações no Modo de Depuração do Desenvolvedor para executar a troca de forma eficiente. Simplesmente limpe seus prompts e clique em Gerar para ativar o recurso de troca de rosto.

3. Gerando imagens de IA com ComfyUI

O ComfyUI oferece aos usuários uma experiência de UI abrangente, porém sofisticada, para geração de imagens usando Stable Diffusion. Primeiro, baixe o ComfyUI e configure-o conforme as instruções.

Etapa 1: Executando o ComfyUI

Após a extração, coloque seus checkpoints e LoRAs no diretório respectivo. Inicie executando update_comfyui.bat dentro da pasta Update para garantir que tudo esteja atualizado.

Quando terminar, inicie o ComfyUI via run_nvidia_gpu.bat ou run_cpu.bat, dependendo do seu hardware, e familiarize-se com a estrutura de nós interconectados que governa a geração de imagens de IA.

Etapa 2: Usando LoRAs no ComfyUI

Para aprimorar ainda mais suas imagens, clique com o botão direito perto do nó do ponto de verificação e escolha carregar um LoRA. Organize as conexões entre os nós corretamente para facilitar o fluxo de dados e garantir uma operação suave durante todo o processo.

Perguntas frequentes

Como a difusão estável, DALL-E e Midjourney se diferenciam?

Todos os três sistemas de IA podem produzir imagens a partir de prompts de texto, mas apenas o Stable Diffusion é totalmente gratuito e de código aberto. Você pode instalá-lo e executá-lo em seu computador sem nenhum custo, enquanto o DALL-E e o Midjourney são softwares proprietários.

O que exatamente é um modelo em Difusão Estável?

Um modelo serve como um arquivo que incorpora um algoritmo de IA treinado usando imagens e palavras-chave específicas. Vários modelos se destacam na geração de tipos distintos de visuais. Por exemplo, alguns podem ser otimizados para representações humanas realistas, enquanto outros são mais adequados para ilustrações 2D ou estilos artísticos diversos.

Informações adicionais

Para mais recursos sobre o Stable Diffusion e seus recursos, considere explorar a página oficial do Stable Diffusion no GitHub, onde você pode encontrar as últimas atualizações e contribuições da comunidade.

Resumo

Este guia abordou os recursos do Stable Diffusion, detalhando seus requisitos e três métodos diferentes de geração de imagens de IA, do Automatic1111 WebUI ao processo simplificado do Fooocus, e as opções de personalização com o ComfyUI. Use essas técnicas para liberar sua criatividade com visuais gerados por IA.

Conclusão

Aproveitar o poder do Stable Diffusion revoluciona a maneira como você cria imagens. Com vários métodos acessíveis e uma riqueza de recursos, mergulhe hoje mesmo para aprimorar suas explorações artísticas com IA.

Postagens relacionadas:

Alex Ruben

Meu objetivo é tornar os tópicos técnicos complexos simples e acessíveis. Neste site, reúno conteúdo único e útil que não só resolve os problemas dos usuários, mas também os ajuda a entender melhor os recursos do Windows.