Esegui facilmente modelli di intelligenza artificiale in locale su Windows 11 con le nuove funzionalità di Microsoft
I PC Copilot+ rappresentano un progresso rivoluzionario in quanto computer inaugurali in grado di eseguire Small Language Models (SLM) direttamente sul dispositivo. Questa tecnologia innovativa offre vantaggi significativi, offrendo risultati più rapidi per varie attività, come la generazione di immagini e testo, rispetto all’applicazione Copilot basata su cloud. Di recente, Microsoft ha presentato AI Dev Gallery, che semplifica l’integrazione delle funzionalità AI sul dispositivo in qualsiasi applicazione.
AI Dev Gallery è progettata specificamente per gli sviluppatori interessati a testare vari modelli per migliorare le loro applicazioni con funzionalità AI. Questo strumento fornisce accesso a oltre 25 campioni scaricabili, che possono essere facilmente eseguiti sul tuo dispositivo. Inoltre, gli utenti possono esportare progetti o codice sorgente direttamente nelle loro applicazioni per una funzionalità immediata. È compatibile sia con Windows 10 che 11, supportando architetture x64 e ARM64.
In un interessante esperimento, Windows Latest ha duplicato AI Dev Gallery dal suo repository GitHub. Attualmente, per accedervi è necessario compilare il progetto tramite Visual Studio prima dell’esecuzione. Inoltre, sono necessari almeno 20 GB di spazio di archiviazione e una CPU multi-core. Sebbene sia consigliata una GPU con 8 GB di VRAM, è essenziale solo per i modelli più esigenti.
Abbiamo iniziato i nostri test con un PC Windows 11 dotato di una CPU a 4 core e 4 GB di RAM. L’app ha due modalità operative: Sample e Models. Abbiamo utilizzato la modalità Sample per esplorare i diversi modelli disponibili, organizzati in categorie tra cui Text, Image, Code, Audio and Video e Smart Controls.
Valutazione dei modelli
I modelli disponibili per la generazione di immagini e video sono relativamente grandi, con dimensioni prossime ai 5 GB. La nostra scelta iniziale è stata un modello più piccolo incentrato sull’upscaling, che era inferiore a 100 MB. Abbiamo fatto uno screenshot e abbiamo provato a farlo ingrandirlo usando la nostra CPU per l’elaborazione. In particolare, è disponibile l’opzione per passare da CPU a GPU per l’elaborazione delle richieste.
Il processo di upscaling è stato completato in meno di 30 secondi su questa modesta macchina virtuale, con un conseguente picco di utilizzo temporaneo della RAM a 1 GB. L’app ha quindi visualizzato un’immagine upscaling con una risoluzione di 9272*4900. Tuttavia, la qualità degli elementi dell’immagine, in particolare del testo, è stata notevolmente compromessa e resa illeggibile.
Purtroppo non è disponibile alcuna funzionalità per visualizzare in anteprima l’immagine generata in un formato più grande o a schermo intero, né è possibile scaricare l’immagine direttamente sul disco.
Abbiamo proceduto a testare un altro modello, noto come Detect Human Pose , che è progettato per accertare il posizionamento degli individui all’interno di un’immagine. Questo modello ha riconosciuto con successo una semplice figura che cammina, ma ha anche iniziato a visualizzare indicatori di posizione su screenshot del nostro desktop con diverse applicazioni aperte.
Sebbene i mezzi esatti per integrare questi modelli nelle applicazioni rimangano poco chiari, alcune funzionalità possono effettivamente essere eseguite localmente. Tuttavia, i PC richiederanno uno spazio di archiviazione sostanziale per questi modelli, insieme a CPU robuste e almeno 16 GB di RAM.
Cosa ne pensi? Vale la pena scaricare un modello da 5 GB per trasformare un prompt di testo in un’immagine, oppure sarebbe più efficiente attendere 30 secondi utilizzando un’applicazione basata sul Web? È evidente che molte di queste funzionalità soddisfano casi d’uso e ambienti operativi specifici, che potrebbero non essere necessariamente interessanti per la più ampia fascia demografica di utenti di Windows 11.
Lascia un commento