Exécutez facilement des modèles d’IA localement sur Windows 11 avec les nouvelles fonctionnalités de Microsoft

Exécutez facilement des modèles d’IA localement sur Windows 11 avec les nouvelles fonctionnalités de Microsoft

Les PC Copilot+ représentent une avancée révolutionnaire en tant que premiers ordinateurs capables d’exécuter des modèles de langage de petite taille (SLM) directement sur l’appareil. Cette technologie innovante offre des avantages significatifs en fournissant des résultats plus rapides pour diverses tâches, telles que la génération d’images et de texte, par rapport à l’application Copilot basée sur le cloud. Récemment, Microsoft a dévoilé l’AI Dev Gallery, qui simplifie l’intégration des capacités d’IA sur l’appareil dans n’importe quelle application.

La galerie AI Dev Gallery est conçue spécifiquement pour les développeurs souhaitant tester différents modèles pour améliorer leurs applications avec des fonctionnalités d’IA. Cet outil donne accès à plus de 25 échantillons téléchargeables, qui peuvent être facilement exécutés sur votre appareil. De plus, les utilisateurs peuvent exporter des projets ou du code source directement dans leurs applications pour une fonctionnalité immédiate. Il est compatible avec Windows 10 et 11, prenant en charge les architectures x64 et ARM64.

Dans une expérience intéressante, Windows Latest a dupliqué la galerie AI Dev Gallery à partir de son référentiel GitHub. Actuellement, pour y accéder, il faut construire le projet via Visual Studio avant de l’exécuter. De plus, un minimum de 20 Go de stockage et un processeur multicœur sont nécessaires. Bien qu’un GPU avec 8 Go de VRAM soit recommandé, il n’est indispensable que pour les modèles plus exigeants.

Nous avons commencé nos tests avec un PC Windows 11 équipé d’un processeur 4 cœurs et de 4 Go de RAM. L’application dispose de deux modes de fonctionnement : Sample et Models. Nous avons utilisé le mode Sample pour explorer les différents modèles disponibles, qui sont organisés en catégories, notamment Texte, Image, Code, Audio et Vidéo et Smart Controls.

Interface de l'application AI Dev Gallery dans Windows 11

Évaluation des modèles

Les modèles disponibles pour la génération d’images et de vidéos sont relativement volumineux, avec des tailles approchant les 5 Go. Notre choix initial était un modèle plus petit axé sur la mise à l’échelle, qui faisait moins de 100 Mo. Nous avons pris une capture d’écran et avons tenté de la mettre à l’échelle en utilisant notre CPU pour le traitement. Notamment, l’option permettant de basculer entre le CPU et le GPU pour le traitement des requêtes est disponible.

Le processus de mise à l’échelle a été réalisé en moins de 30 secondes sur cette modeste machine virtuelle, ce qui a entraîné une utilisation temporaire de la RAM atteignant 1 Go. L’application a ensuite affiché une image mise à l’échelle avec une résolution de 9272*4900. Cependant, la qualité des éléments de l’image, en particulier du texte, a été considérablement compromise et rendue illisible.

Amélioration du modèle d'image IA dans l'application AI Dev Gallery

Malheureusement, il n’existe aucune fonctionnalité permettant de prévisualiser l’image générée dans un format plus grand ou en mode plein écran, ni d’option permettant de télécharger l’image directement sur votre disque.

Nous avons ensuite testé un autre modèle, appelé Detect Human Pose , qui est conçu pour déterminer le positionnement des individus dans une image. Ce modèle a reconnu avec succès une simple silhouette en train de marcher, mais a également commencé à afficher des marqueurs de position sur des captures d’écran de notre bureau comportant plusieurs applications ouvertes.

Démonstration du modèle Détecter la pose humaine dans l'application AI Dev Gallery

Si les modalités exactes d’intégration de ces modèles dans les applications restent floues, certaines fonctionnalités peuvent bel et bien être exécutées localement. Néanmoins, les PC nécessiteront un espace de stockage conséquent pour ces modèles, ainsi que des processeurs robustes et au moins 16 Go de RAM.

Qu’en pensez-vous ? Vaut-il la peine de télécharger un modèle volumineux de 5 Go pour transformer une invite de texte en image, ou serait-il plus efficace d’attendre 30 secondes à l’aide d’une application Web ? Il est évident que bon nombre de ces fonctionnalités s’adressent à des cas d’utilisation et à des environnements opérationnels spécifiques, qui ne plairont pas nécessairement à la population plus large des utilisateurs de Windows 11.

Source et images

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *