Les meilleures méthodes gratuites pour créer des images IA à l’aide de la diffusion stable
Avez-vous déjà souhaité générer des images IA sans avoir recours à des outils en ligne ? De nombreux générateurs d’images en ligne gratuits limitent le nombre de sorties et demandent souvent un abonnement après seulement quelques tentatives. Présentation de Stable Diffusion : un générateur d’images IA gratuit et open source qui vous permet de créer des images à domicile sans aucune limitation.
Qu’est-ce que la diffusion stable ?
Stable Diffusion est un framework open source gratuit qui transforme le texte en images visuelles en fonction de vos descriptions. Bien qu’il ne s’agisse pas d’une application autonome, elle sert de technologie clé utilisée par diverses applications. En matière d’IA générative pour la création d’images, Stable Diffusion reste l’un des principaux prétendants. Ce guide met en évidence trois approches d’utilisation de Stable Diffusion, allant de la plus conviviale pour les débutants à la plus complexe, avec des fonctionnalités uniques pour chaque méthode.
Configuration requise
Voici les spécifications recommandées pour une expérience réussie :
- macOS : Apple Silicon (puce série M)
- Windows ou Linux : GPU NVIDIA ou AMD
- RAM : 16 Go pour des performances optimales
- GPU VRAM : au moins 4 Go (8 Go de préférence)
- Stockage : 60-70 Go d’espace disponible
1. Utilisation de l’interface Web Automatic1111
La première approche consiste à utiliser l’interface Web AUTOMATIC1111 pour accéder à Stable Diffusion, compatible avec tous les principaux systèmes d’exploitation.
Commencez par télécharger la dernière version stable de Python . Après le téléchargement, exécutez le programme d’installation et assurez-vous de sélectionner Ajouter python.exe au CHEMIN avant de cliquer sur Installer maintenant .
Ensuite, accédez au référentiel de l’interface utilisateur Web AUTOMATIC1111 sur GitHub, cliquez sur Code et sélectionnez Télécharger le ZIP . Une fois le téléchargement terminé, décompressez le fichier et mémorisez l’emplacement où l’interface utilisateur Web a été installée.
Installer un modèle
Avant de commencer à utiliser l’interface utilisateur Web, vous devez installer au moins un modèle. Ces modèles sont des points de contrôle pré-entraînés qui déterminent le style artistique pour la génération d’images. Pour sélectionner un modèle, visitez CIVITAI et choisissez celui qui vous convient.
Après avoir trouvé votre modèle préféré, cliquez sur le bouton de téléchargement. Une fois terminé, transférez le fichier de point de contrôle « .safetensors » dans le dossier approprié. Accédez au répertoire de téléchargement de votre interface Web Automatic1111, puis accédez à webui -> models -> Stable-diffusion . Collez le fichier de modèle téléchargé dans ce répertoire et vous êtes prêt à partir.
Exécuter et configurer l’interface utilisateur Web
Vous pouvez désormais exécuter et utiliser Stable Diffusion directement dans votre navigateur Web.
Sous macOS, accédez à votre dossier « stable-diffusion-webui » via Terminal et exécutez la commande ./webui.sh --xformers
. Pour les utilisateurs Windows, exécutez ./webui-user.bat
. Une fois l’opération terminée, copiez l’URL fournie à côté de « Exécution sur une URL locale », qui apparaît généralement sous la forme http://127.0.0.1:7860 .
Saisissez l’URL dans la barre d’adresse de votre navigateur et appuyez sur Enter. L’interface Web se chargera localement dans votre navigateur Internet par défaut. Bien que l’interface initiale puisse paraître complexe, vous n’aurez pas besoin de modifier de nombreux paramètres au départ.
Commencez par ajuster les paramètres Largeur et Hauteur et définissez la taille du lot sur 4, ce qui générera quatre images distinctes pour chaque invite.
Ensuite, saisissez une invite créative dans l’ onglet txt2img . Soyez précis sur les détails que vous souhaitez dans l’image, en séparant les différents descripteurs par des virgules. De plus, décrivez le style artistique en utilisant des termes tels que « réaliste », « détaillé » ou « portrait en gros plan ».
Dans la zone réservée aux invites négatives, incluez tous les éléments que vous souhaitez exclure de votre image. Pensez à modifier le paramètre « Échelle CFG » ; une valeur plus élevée permet au générateur d’adhérer plus étroitement aux invites données, tandis qu’une valeur plus faible permet des résultats plus créatifs.
Laissez les autres paramètres inchangés et cliquez sur Générer en haut pour lancer le processus de génération d’image. Ensuite, vous pouvez cliquer sur les images miniatures pour les visualiser et décider si elles répondent à vos attentes. Si ce n’est pas le cas, n’hésitez pas à ajuster l’ échelle CFG et vos invites. Au cours de cette étape, votre GPU sera fortement sollicité.
Si vous trouvez une image qui vous plaît mais que vous souhaitez la peaufiner ou corriger des problèmes (comme des éléments déformés), cliquez sur Envoyer vers img2img ou Envoyer vers inpaint . Cette option transférera votre image et les invites vers leurs onglets respectifs pour une amélioration supplémentaire.
2. À la découverte de Fooocus : le générateur d’images IA le plus simple
Fooocus se distingue comme l’un des outils de génération d’images IA les plus simples et les plus efficaces disponibles. Son interface intuitive le rend accessible aux débutants qui souhaitent expérimenter la création d’images IA avant de se lancer dans des méthodes plus complexes.
Téléchargez le fichier compressé Fooocus et extrayez-le une fois le téléchargement terminé. Ensuite, rendez-vous sur CIVITAI pour choisir un point de contrôle qui vous convient. Après avoir téléchargé le point de contrôle, accédez à votre dossier Fooocus. Cliquez sur Fooocus -> models -> checkpoints et placez-y le fichier de point de contrôle que vous avez téléchargé.
Vous pouvez également télécharger des fichiers LoRA depuis Civitai, qui sont des fichiers plus petits qui améliorent les grands modèles de langage avec de nouveaux concepts ou styles. Contrairement aux points de contrôle, qui peuvent représenter plusieurs gigaoctets, les LoRA ajoutent des éléments distinctifs aux images finales tout en utilisant un point de contrôle existant.
Si vous choisissez d’utiliser un LoRA pour améliorer le style visuel de vos images IA, revenez au dossier models dans votre répertoire Fooocus et collez le fichier LoRA dans le dossier loras .
Exécution de Fooocus
Il est temps de commencer à générer des images dans Fooocus. Accédez au dossier dans lequel vous avez extrait le logiciel et double-cliquez sur run.bat . L’invite de commande apparaît et charge automatiquement l’interface Fooocus dans votre navigateur Web.
Sur l’écran d’ouverture, assurez-vous de cocher l’ option Avancé en bas, qui révélera des paramètres supplémentaires. Ici, vous pouvez sélectionner le rapport hauteur/largeur souhaité, le nombre d’images que Fooocus générera par invite et choisir le format du fichier image.
Dans un premier temps, définissez l’option de performance sur Vitesse , car cela augmentera considérablement la vitesse de génération de l’image. En bas, saisissez des invites négatives pour les éléments indésirables.
Passez la souris sur chaque style pour le prévisualiser. Ensuite, accédez à l’onglet Modèles, où vous pouvez sélectionner le modèle de base que vous avez placé dans votre dossier Fooocus. Juste en dessous, choisissez un LoRA si vous en avez installé un.
Il ne vous reste plus qu’à cliquer sur le bouton Générer et à regarder Fooocus créer les images souhaitées. Bien qu’il ne soit peut-être pas le générateur d’images le plus puissant disponible, Fooocus s’avère certainement être la méthode la plus simple, permettant des ajustements faciles des styles, des points de contrôle et des LoRA pour créer vos images idéales.
Utilisation de l’échange de visages par IA dans Fooocus
Fooocus propose même une fonction FaceSwap, qui vous permet de remplacer les visages d’une image par d’autres. Tout d’abord, cochez l’ option Image d’entrée en bas, puis sélectionnez Invite d’image . Ici, téléchargez l’image avec laquelle vous souhaitez échanger le visage. Faites défiler vers le bas, cliquez à nouveau sur Avancé et, parmi les options, choisissez FaceSwap .
À côté de la section Invite d’image , cliquez sur l’onglet Inpaint ou Outpaint et téléchargez l’image pour l’échange de visage. Tracez le contour du visage et des cheveux, puis accédez à l’ onglet Avancé dans le coin supérieur droit. Activez le mode de débogage du développeur , cliquez sur Contrôle et cochez la case pour mélanger l’invite d’image et Inpaint .
Une fois terminé, effacez la boîte de dialogue et cliquez sur Générer . Cela exécutera l’échange de visage avec votre image sélectionnée, produisant des résultats variés.
Après avoir généré vos images, vous souhaiterez peut-être les améliorer à l’aide de certains outils de mise à l’échelle d’images IA de premier ordre pour améliorer leur résolution.
3. Générer des images IA avec ComfyUI
ComfyUI est une autre méthode privilégiée pour exploiter la diffusion stable pour la création d’images IA. Bien que le flux de travail puisse être plus engageant, il est également plus complexe. Pour commencer, téléchargez et extrayez ComfyUI depuis GitHub.
Vous connaissez probablement les points de contrôle et les LoRA à ce stade. Comme mentionné précédemment, téléchargez un fichier de point de contrôle (et un fichier LoRA si vous le souhaitez) et placez-le dans les dossiers appropriés dans le répertoire models de ComfyUI. Dans votre répertoire ComfyUI, ouvrez le dossier Update et exécutez update_comfyui.bat pour préparer la configuration.
Il est maintenant temps d’exécuter le générateur d’images ComfyUI AI. Revenez à votre répertoire ComfyUI, où vous devriez voir deux fichiers batch. Si vous avez un GPU Nvidia, double-cliquez sur run_nvidia_gpu.bat ; sinon, exécutez run_cpu.bat .
Une fois ComfyUI lancé dans votre navigateur, vous verrez son flux de travail par défaut, qui comprend plusieurs nœuds interconnectés. Bien que cela puisse paraître complexe au départ, ces nœuds représentent différentes étapes du processus de génération d’images par l’IA.
Les multiples nœuds vous permettent de créer un flux de travail personnalisé, intégrant différents nœuds, modèles, LoRA et raffineurs, offrant aux utilisateurs un contrôle étendu sur le résultat final. Cependant, cette complexité peut rendre ComfyUI difficile à parcourir et à maîtriser.
Exécution de ComfyUI
Pour commencer, sélectionnez un point de contrôle dans le nœud Charger le point de contrôle . Accédez au nœud Encodage de texte CLIP (invite) , où vous saisirez votre invite de texte pour l’image. En dessous se trouve un nœud d’invite négative correspondant pour les descripteurs indésirables. Dans le nœud Image latente vide , vous pouvez ajuster la largeur, la hauteur et le nombre d’images que vous souhaitez générer.
Une fois que vous avez défini vos invites, ajustez les dimensions de l’image, la taille du lot et les étapes clés du traitement. Environ 20 à 30 étapes produisent généralement une image de bonne qualité. Enfin, appuyez sur le bouton Invite de file d’attente et laissez ComfyUI faire le travail.
Utilisation de LoRA dans ComfyUI
Pour inclure certains LoRA dans ComfyUI, cliquez simplement avec le bouton droit de la souris près du nœud du point de contrôle et choisissez Ajouter un nœud -> chargeurs -> Charger LoRA . Sélectionnez n’importe quel LoRA dans votre dossier dans le répertoire.
Cependant, gardez à l’esprit que chaque fois qu’un nouveau nœud LoRA est ajouté, vous devrez réorganiser les connexions. Faites glisser la ligne du nœud Checkpoint intitulé Model vers le point d’entrée du modèle du nœud LoRA sur le côté gauche au lieu du KSampler. Ensuite, reconnectez le point de sortie du nœud LoRA à l’entrée du modèle du KSampler.
Assurez-vous que les deux lignes Clip du nœud Checkpoint sont dirigées vers chaque nœud Prompt. De même, connectez les points d’entrée du côté gauche du Clip du LoRA aux invites positives et négatives.
En comprenant le flux de travail par défaut et en ajoutant progressivement des nœuds personnalisés, vous deviendrez compétent dans l’utilisation de ComfyUI pour vos besoins de génération d’images IA.
Questions fréquemment posées
Comment Stable Diffusion, DALL-E et Midjourney se différencient-ils ?
Les trois systèmes d’IA peuvent produire des images à partir d’invites de texte, mais seul Stable Diffusion est entièrement gratuit et open source. Vous pouvez l’installer et l’exécuter sur votre ordinateur sans aucun coût, tandis que DALL-E et Midjourney sont des logiciels propriétaires.
Qu’est-ce qu’un modèle exactement dans Stable Diffusion ?
Un modèle est un fichier qui contient un algorithme d’IA formé à l’aide d’images et de mots-clés spécifiques. Différents modèles excellent dans la génération de différents types de visuels. Par exemple, certains peuvent être optimisés pour des représentations humaines réalistes, tandis que d’autres sont mieux adaptés aux illustrations 2D ou à divers styles artistiques.
Crédit photo : Image principale de Stable Diffusion. Toutes les captures d’écran ont été fournies par Brandon Li et Samarveer Singh.
Laisser un commentaire