Les meilleures méthodes gratuites pour créer des images IA à l’aide de la diffusion stable

Les meilleures méthodes gratuites pour créer des images IA à l’aide de la diffusion stable
Un artiste numérique engagé dans un environnement futuriste, utilisant un dispositif informatique sophistiqué avec de nombreux écrans.

Avez-vous déjà souhaité générer des images IA sans avoir recours à des outils en ligne ? De nombreux générateurs d’images en ligne gratuits limitent le nombre de sorties et demandent souvent un abonnement après seulement quelques tentatives. Présentation de Stable Diffusion : un générateur d’images IA gratuit et open source qui vous permet de créer des images à domicile sans aucune limitation.

Qu’est-ce que la diffusion stable ?

Stable Diffusion est un framework open source gratuit qui transforme le texte en images visuelles en fonction de vos descriptions. Bien qu’il ne s’agisse pas d’une application autonome, elle sert de technologie clé utilisée par diverses applications. En matière d’IA générative pour la création d’images, Stable Diffusion reste l’un des principaux prétendants. Ce guide met en évidence trois approches d’utilisation de Stable Diffusion, allant de la plus conviviale pour les débutants à la plus complexe, avec des fonctionnalités uniques pour chaque méthode.

Configuration requise

Voici les spécifications recommandées pour une expérience réussie :

  • macOS : Apple Silicon (puce série M)
  • Windows ou Linux : GPU NVIDIA ou AMD
  • RAM : 16 Go pour des performances optimales
  • GPU VRAM : au moins 4 Go (8 Go de préférence)
  • Stockage : 60-70 Go d’espace disponible

1. Utilisation de l’interface Web Automatic1111

La première approche consiste à utiliser l’interface Web AUTOMATIC1111 pour accéder à Stable Diffusion, compatible avec tous les principaux systèmes d’exploitation.

Commencez par télécharger la dernière version stable de Python . Après le téléchargement, exécutez le programme d’installation et assurez-vous de sélectionner Ajouter python.exe au CHEMIN avant de cliquer sur Installer maintenant .

Une capture d'écran présentant le programme d'installation de Windows Python 3.13.0.

Ensuite, accédez au référentiel de l’interface utilisateur Web AUTOMATIC1111 sur GitHub, cliquez sur Code et sélectionnez Télécharger le ZIP . Une fois le téléchargement terminé, décompressez le fichier et mémorisez l’emplacement où l’interface utilisateur Web a été installée.

Installer un modèle

Avant de commencer à utiliser l’interface utilisateur Web, vous devez installer au moins un modèle. Ces modèles sont des points de contrôle pré-entraînés qui déterminent le style artistique pour la génération d’images. Pour sélectionner un modèle, visitez CIVITAI et choisissez celui qui vous convient.

Une capture d'écran du site Web CIVIT.AI affichant des exemples de ce que le modèle d'image Pony Realism AI basé sur la diffusion stable peut générer.

Après avoir trouvé votre modèle préféré, cliquez sur le bouton de téléchargement. Une fois terminé, transférez le fichier de point de contrôle « .safetensors » dans le dossier approprié. Accédez au répertoire de téléchargement de votre interface Web Automatic1111, puis accédez à webui -> models -> Stable-diffusion . Collez le fichier de modèle téléchargé dans ce répertoire et vous êtes prêt à partir.

Exécuter et configurer l’interface utilisateur Web

Vous pouvez désormais exécuter et utiliser Stable Diffusion directement dans votre navigateur Web.

Sous macOS, accédez à votre dossier « stable-diffusion-webui » via Terminal et exécutez la commande ./webui.sh --xformers. Pour les utilisateurs Windows, exécutez ./webui-user.bat. Une fois l’opération terminée, copiez l’URL fournie à côté de « Exécution sur une URL locale », qui apparaît généralement sous la forme http://127.0.0.1:7860 .

Capture d'écran du terminal macOS, montrant le générateur d'images Stable Diffusion Automatic1111 AI exécuté localement.

Saisissez l’URL dans la barre d’adresse de votre navigateur et appuyez sur Enter. L’interface Web se chargera localement dans votre navigateur Internet par défaut. Bien que l’interface initiale puisse paraître complexe, vous n’aurez pas besoin de modifier de nombreux paramètres au départ.

Commencez par ajuster les paramètres Largeur et Hauteur et définissez la taille du lot sur 4, ce qui générera quatre images distinctes pour chaque invite.

Une capture d'écran d'Automatic1111 utilisant la diffusion stable pour la génération d'images AI.

Ensuite, saisissez une invite créative dans l’ onglet txt2img . Soyez précis sur les détails que vous souhaitez dans l’image, en séparant les différents descripteurs par des virgules. De plus, décrivez le style artistique en utilisant des termes tels que « réaliste », « détaillé » ou « portrait en gros plan ».

Capture d'écran des entrées d'invite effectuées dans Automatic1111.

Dans la zone réservée aux invites négatives, incluez tous les éléments que vous souhaitez exclure de votre image. Pensez à modifier le paramètre « Échelle CFG » ; une valeur plus élevée permet au générateur d’adhérer plus étroitement aux invites données, tandis qu’une valeur plus faible permet des résultats plus créatifs.

Laissez les autres paramètres inchangés et cliquez sur Générer en haut pour lancer le processus de génération d’image. Ensuite, vous pouvez cliquer sur les images miniatures pour les visualiser et décider si elles répondent à vos attentes. Si ce n’est pas le cas, n’hésitez pas à ajuster l’ échelle CFG et vos invites. Au cours de cette étape, votre GPU sera fortement sollicité.

Capture d'écran présentant plusieurs images générées par le modèle Stable Diffusion AI.

Si vous trouvez une image qui vous plaît mais que vous souhaitez la peaufiner ou corriger des problèmes (comme des éléments déformés), cliquez sur Envoyer vers img2img ou Envoyer vers inpaint . Cette option transférera votre image et les invites vers leurs onglets respectifs pour une amélioration supplémentaire.

2. À la découverte de Fooocus : le générateur d’images IA le plus simple

Fooocus se distingue comme l’un des outils de génération d’images IA les plus simples et les plus efficaces disponibles. Son interface intuitive le rend accessible aux débutants qui souhaitent expérimenter la création d’images IA avant de se lancer dans des méthodes plus complexes.

Une capture d'écran de CIVIT.AI, mettant en évidence des exemples d'images générées par l'IA avec Stable Diffusion, comme un temple de montagne et une jeune femme aux cheveux blonds.

Téléchargez le fichier compressé Fooocus et extrayez-le une fois le téléchargement terminé. Ensuite, rendez-vous sur CIVITAI pour choisir un point de contrôle qui vous convient. Après avoir téléchargé le point de contrôle, accédez à votre dossier Fooocus. Cliquez sur Fooocus -> models -> checkpoints et placez-y le fichier de point de contrôle que vous avez téléchargé.

Une capture d'écran du répertoire des points de contrôle dans le logiciel générateur d'images Fooocus AI.

Vous pouvez également télécharger des fichiers LoRA depuis Civitai, qui sont des fichiers plus petits qui améliorent les grands modèles de langage avec de nouveaux concepts ou styles. Contrairement aux points de contrôle, qui peuvent représenter plusieurs gigaoctets, les LoRA ajoutent des éléments distinctifs aux images finales tout en utilisant un point de contrôle existant.

Un exemple de fichier LoRA téléchargeable depuis CIVIT.AI.

Si vous choisissez d’utiliser un LoRA pour améliorer le style visuel de vos images IA, revenez au dossier models dans votre répertoire Fooocus et collez le fichier LoRA dans le dossier loras .

Exécution de Fooocus

Il est temps de commencer à générer des images dans Fooocus. Accédez au dossier dans lequel vous avez extrait le logiciel et double-cliquez sur run.bat . L’invite de commande apparaît et charge automatiquement l’interface Fooocus dans votre navigateur Web.

Une capture d'écran affichant le flux de travail de l'interface utilisateur Fooocus pour la génération d'images de diffusion stable avec des paramètres avancés.

Sur l’écran d’ouverture, assurez-vous de cocher l’ option Avancé en bas, qui révélera des paramètres supplémentaires. Ici, vous pouvez sélectionner le rapport hauteur/largeur souhaité, le nombre d’images que Fooocus générera par invite et choisir le format du fichier image.

Dans un premier temps, définissez l’option de performance sur Vitesse , car cela augmentera considérablement la vitesse de génération de l’image. En bas, saisissez des invites négatives pour les éléments indésirables.

Passez la souris sur chaque style pour le prévisualiser. Ensuite, accédez à l’onglet Modèles, où vous pouvez sélectionner le modèle de base que vous avez placé dans votre dossier Fooocus. Juste en dessous, choisissez un LoRA si vous en avez installé un.

Une image présentant deux visuels générés par l'IA dans Fooocus, mettant en vedette une femme futuriste dans un décor cyberpunk.

Il ne vous reste plus qu’à cliquer sur le bouton Générer et à regarder Fooocus créer les images souhaitées. Bien qu’il ne soit peut-être pas le générateur d’images le plus puissant disponible, Fooocus s’avère certainement être la méthode la plus simple, permettant des ajustements faciles des styles, des points de contrôle et des LoRA pour créer vos images idéales.

Utilisation de l’échange de visages par IA dans Fooocus

Fooocus propose même une fonction FaceSwap, qui vous permet de remplacer les visages d’une image par d’autres. Tout d’abord, cochez l’ option Image d’entrée en bas, puis sélectionnez Invite d’image . Ici, téléchargez l’image avec laquelle vous souhaitez échanger le visage. Faites défiler vers le bas, cliquez à nouveau sur Avancé et, parmi les options, choisissez FaceSwap .

Une capture d'écran du générateur d'images Fooocus AI, montrant l'image d'une femme cyborg futuriste subissant un FaceSwap.

À côté de la section Invite d’image , cliquez sur l’onglet Inpaint ou Outpaint et téléchargez l’image pour l’échange de visage. Tracez le contour du visage et des cheveux, puis accédez à l’ onglet Avancé dans le coin supérieur droit. Activez le mode de débogage du développeur , cliquez sur Contrôle et cochez la case pour mélanger l’invite d’image et Inpaint .

Une image démontrant la fonction de retouche dans Fooocus, mettant en évidence le visage à échanger.

Une fois terminé, effacez la boîte de dialogue et cliquez sur Générer . Cela exécutera l’échange de visage avec votre image sélectionnée, produisant des résultats variés.

Le résultat d'un échange de visage exécuté par le générateur d'images Fooocus AI.

Après avoir généré vos images, vous souhaiterez peut-être les améliorer à l’aide de certains outils de mise à l’échelle d’images IA de premier ordre pour améliorer leur résolution.

3. Générer des images IA avec ComfyUI

ComfyUI est une autre méthode privilégiée pour exploiter la diffusion stable pour la création d’images IA. Bien que le flux de travail puisse être plus engageant, il est également plus complexe. Pour commencer, téléchargez et extrayez ComfyUI depuis GitHub.

Vous connaissez probablement les points de contrôle et les LoRA à ce stade. Comme mentionné précédemment, téléchargez un fichier de point de contrôle (et un fichier LoRA si vous le souhaitez) et placez-le dans les dossiers appropriés dans le répertoire models de ComfyUI. Dans votre répertoire ComfyUI, ouvrez le dossier Update et exécutez update_comfyui.bat pour préparer la configuration.

Une capture d'écran Windows du répertoire ComfyUI, affichant le fichier de commandes de mise à jour et sa fenêtre d'invite de commande.

Il est maintenant temps d’exécuter le générateur d’images ComfyUI AI. Revenez à votre répertoire ComfyUI, où vous devriez voir deux fichiers batch. Si vous avez un GPU Nvidia, double-cliquez sur run_nvidia_gpu.bat ; sinon, exécutez run_cpu.bat .

Une fois ComfyUI lancé dans votre navigateur, vous verrez son flux de travail par défaut, qui comprend plusieurs nœuds interconnectés. Bien que cela puisse paraître complexe au départ, ces nœuds représentent différentes étapes du processus de génération d’images par l’IA.

Une capture d'écran du flux de travail par défaut de ComfyUI, reflétant le processus de génération d'images IA.

Les multiples nœuds vous permettent de créer un flux de travail personnalisé, intégrant différents nœuds, modèles, LoRA et raffineurs, offrant aux utilisateurs un contrôle étendu sur le résultat final. Cependant, cette complexité peut rendre ComfyUI difficile à parcourir et à maîtriser.

Exécution de ComfyUI

Pour commencer, sélectionnez un point de contrôle dans le nœud Charger le point de contrôle . Accédez au nœud Encodage de texte CLIP (invite) , où vous saisirez votre invite de texte pour l’image. En dessous se trouve un nœud d’invite négative correspondant pour les descripteurs indésirables. Dans le nœud Image latente vide , vous pouvez ajuster la largeur, la hauteur et le nombre d’images que vous souhaitez générer.

Une capture d'écran du flux de travail de ComfyUI, illustrant le sélecteur de point de contrôle, les champs d'invite positifs et négatifs et les paramètres d'image latente vides.

Une fois que vous avez défini vos invites, ajustez les dimensions de l’image, la taille du lot et les étapes clés du traitement. Environ 20 à 30 étapes produisent généralement une image de bonne qualité. Enfin, appuyez sur le bouton Invite de file d’attente et laissez ComfyUI faire le travail.

Une capture d'écran du flux de travail de génération d'images de ComfyUI, capturant la création d'images avec un éléphant aux couleurs vives.

Utilisation de LoRA dans ComfyUI

Pour inclure certains LoRA dans ComfyUI, cliquez simplement avec le bouton droit de la souris près du nœud du point de contrôle et choisissez Ajouter un nœud -> chargeurs -> Charger LoRA . Sélectionnez n’importe quel LoRA dans votre dossier dans le répertoire.

Une capture d'écran du flux de travail ComfyUI, montrant comment ajouter un nœud LoRA pour améliorer les images générées par l'IA.

Cependant, gardez à l’esprit que chaque fois qu’un nouveau nœud LoRA est ajouté, vous devrez réorganiser les connexions. Faites glisser la ligne du nœud Checkpoint intitulé Model vers le point d’entrée du modèle du nœud LoRA sur le côté gauche au lieu du KSampler. Ensuite, reconnectez le point de sortie du nœud LoRA à l’entrée du modèle du KSampler.

Une capture d'écran du flux de travail de ComfyUI, montrant comment connecter un nœud LoRA du point de contrôle au KSampler.

Assurez-vous que les deux lignes Clip du nœud Checkpoint sont dirigées vers chaque nœud Prompt. De même, connectez les points d’entrée du côté gauche du Clip du LoRA aux invites positives et négatives.

Une capture d'écran du flux de travail de génération d'images de ComfyUI, montrant les connexions pour l'intégration d'un LoRA entre les nœuds Checkpoint et Prompt.

En comprenant le flux de travail par défaut et en ajoutant progressivement des nœuds personnalisés, vous deviendrez compétent dans l’utilisation de ComfyUI pour vos besoins de génération d’images IA.

Questions fréquemment posées

Comment Stable Diffusion, DALL-E et Midjourney se différencient-ils ?

Les trois systèmes d’IA peuvent produire des images à partir d’invites de texte, mais seul Stable Diffusion est entièrement gratuit et open source. Vous pouvez l’installer et l’exécuter sur votre ordinateur sans aucun coût, tandis que DALL-E et Midjourney sont des logiciels propriétaires.

Qu’est-ce qu’un modèle exactement dans Stable Diffusion ?

Un modèle est un fichier qui contient un algorithme d’IA formé à l’aide d’images et de mots-clés spécifiques. Différents modèles excellent dans la génération de différents types de visuels. Par exemple, certains peuvent être optimisés pour des représentations humaines réalistes, tandis que d’autres sont mieux adaptés aux illustrations 2D ou à divers styles artistiques.

Crédit photo : Image principale de Stable Diffusion. Toutes les captures d’écran ont été fournies par Brandon Li et Samarveer Singh.

Source et images

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *