Investigador enseña a GPT-4 a jugar DOOM y matar todo lo que esté a la vista

2024/03/12

Todos conocemos el shooter DOOM de 1993 y en aquel momento se probaba cualquier hardware con la pregunta: ¿jugará a DOOM? The Register detectó un proyecto estudiantil que demuestra la capacidad de GPT-4 para jugar el juego antiguo.

Adrian de Wynter, científico aplicado principal de Microsoft e investigador de la Universidad de York en Inglaterra, desarrolló un método para probar si las capacidades de razonamiento y planificación de GPT-4 se extienden al juego de disparos en primera persona Doom de 1993. Resulta que sí, el bot puede ejecutarlo y jugarlo, pero puedes vencerlo fácilmente.

¿Cómo puede GPT-4 ejecutar DOOM?

De hecho, es más complicado porque el GPT-4 LLM no puede ejecutar el código de DOOM directamente, pero su variante, GPT-4V, también puede trabajar con imágenes y jugar sin ningún entrenamiento especial.

Entonces, de Winter usó GPT-4V para obtener capturas de pantalla del juego, junto con descripciones de la estructura. Luego, un modelo de Agente puede tomar decisiones basadas en la entrada visual y el historial previo. Los comandos del juego se devuelven y se traducen en pulsaciones de teclas.

Eso hace que el modelo sea bastante lento a la hora de jugar, pero también tiene otros problemas:

Entonces, GPT-4V simplemente se olvida de los enemigos si se pierden de vista, lo que podría ser un problema divertido incluso para el jugador humano más inexperto.

Pero el problema aquí no son las escasas habilidades del robot para matar monstruos en un juego, sino las ramificaciones éticas de la programación:

En otras palabras, la IA estaba más que feliz de seguir las instrucciones para disparar a los objetivos sin hacer preguntas. Aunque puede ser divertido ver a una IA jugando y tomando sus propias decisiones para completar sus objetivos de programación, la conclusión del investigador es que el robot no tiene idea de lo que está haciendo.

Después de todo, esta programación podría usarse en escenarios reales para drones automatizados que podrían producir daños reales.

¿Qué opinas sobre GPT-4 jugando DOOM? Hablemos de eso en la sección de comentarios a continuación.

En el departamento de ética, es bastante preocupante lo fácil que fue para (a) mí crear código para lograr que el modelo filmara algo; y (b) que el modelo dispare algo con precisión sin dudar de las instrucciones,

Adrián de Wynter

Por ejemplo, sería muy común que el modelo viera un zombie en pantalla, y comenzara a dispararle hasta que lo impactara (o muriera). ¿Cuál es el problema aquí? Bueno, primero que el zombie se pierda de vista. Peor aún, todavía está vivo y te matará en algún momento. Entonces tienes que ir tras ello, ¿verdad? Después de todo, en Doom, es golpear o ser golpeado. Resulta que GPT-4 se olvida del zombie y sigue adelante. Nota: el mensaje le dice explícitamente al modelo qué hacer si está recibiendo daño y no puede ver a un enemigo. Mejor aún, simplemente sigue su camino alegremente, se atasca en un rincón y muere. Dio la vuelta un par de veces, pero en casi 50-60 carreras, lo observé… dos veces, quiero decir.

Adrián de Wynter

¿Cómo puede GPT-4 ejecutar DOOM?

Deja una respuesta Cancelar la respuesta