Ejecute fácilmente modelos de IA de forma local en Windows 11 con las nuevas funciones de Microsoft

Ejecute fácilmente modelos de IA de forma local en Windows 11 con las nuevas funciones de Microsoft

Las PC Copilot+ representan un avance revolucionario, ya que son las primeras computadoras capaces de ejecutar Small Language Models (SLM) directamente en el dispositivo. Esta tecnología innovadora ofrece ventajas significativas al ofrecer resultados más rápidos para diversas tareas, como la generación de imágenes y texto, en comparación con la aplicación Copilot basada en la nube. Recientemente, Microsoft presentó AI Dev Gallery, que simplifica la integración de las capacidades de inteligencia artificial del dispositivo en cualquier aplicación.

La galería de desarrollo de IA está diseñada específicamente para desarrolladores interesados ​​en probar varios modelos para mejorar sus aplicaciones con funciones de IA. Esta herramienta brinda acceso a más de 25 muestras descargables, que se pueden ejecutar fácilmente en su dispositivo. Además, los usuarios pueden exportar proyectos o código fuente directamente a sus aplicaciones para obtener una funcionalidad inmediata. Es compatible con Windows 10 y 11, y admite arquitecturas x64 y ARM64.

En un interesante experimento, Windows Latest duplicó la AI Dev Gallery de su repositorio de GitHub. Actualmente, para acceder a ella es necesario compilar el proyecto a través de Visual Studio antes de ejecutarlo. Además, es necesario un mínimo de 20 GB de almacenamiento y una CPU multinúcleo. Aunque se recomienda una GPU con 8 GB de VRAM, solo es imprescindible para los modelos más exigentes.

Iniciamos nuestras pruebas con una PC con Windows 11 equipada con una CPU de 4 núcleos y 4 GB de RAM. La aplicación tiene dos modos operativos: Muestra y Modelos. Utilizamos el modo Muestra para explorar los diversos modelos disponibles, que están organizados en categorías que incluyen Texto, Imagen, Código, Audio y Video, y Controles Inteligentes.

Interfaz de la aplicación AI Dev Gallery en Windows 11

Evaluación de los modelos

Los modelos disponibles para la generación de imágenes y vídeos son relativamente grandes, con tamaños que se acercan a los 5 GB. Nuestra elección inicial fue un modelo más pequeño enfocado en el escalado, que ocupaba menos de 100 MB. Hicimos una captura de pantalla e intentamos escalarla usando nuestra CPU para el procesamiento. Cabe destacar que está disponible la opción de cambiar entre CPU y GPU para procesar solicitudes.

El proceso de ampliación se completó en menos de 30 segundos en esta modesta máquina virtual, lo que provocó que el uso de RAM temporal alcanzara un máximo de 1 GB. A continuación, la aplicación mostró una imagen ampliada con una resolución de 9272*4900. Sin embargo, la calidad de los elementos de la imagen, en particular el texto, se vio comprometida considerablemente y se volvió ilegible.

Mejora del modelo de imagen de IA en la aplicación AI Dev Gallery

Lamentablemente, no hay ninguna funcionalidad disponible para obtener una vista previa de la imagen generada en un formato más grande o en modo de pantalla completa, ni hay una opción para descargar la imagen directamente a su disco.

Procedimos a probar otro modelo, conocido como Detect Human Pose , que está diseñado para determinar la posición de los individuos dentro de una imagen. Este modelo reconoció con éxito una figura sencilla caminando, pero también comenzó a mostrar marcadores de posición sobre capturas de pantalla de nuestro escritorio con varias aplicaciones abiertas.

Demostración del modelo Detect Human Pose en la aplicación AI Dev Gallery

Aunque no está claro cómo se integrarán estos modelos en las aplicaciones, algunas funciones sí pueden ejecutarse localmente. No obstante, los PC requerirán un espacio de almacenamiento considerable para estos modelos, junto con CPU robustas y al menos 16 GB de RAM.

¿Qué opinas al respecto? ¿Vale la pena descargar un modelo de 5 GB para transformar un mensaje de texto en una imagen o sería más eficiente esperar 30 segundos usando una aplicación web? Es evidente que muchas de estas funciones están pensadas para casos de uso y entornos operativos específicos, que pueden no ser necesariamente atractivos para el grupo demográfico más amplio de usuarios de Windows 11.

Fuente e imágenes

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *