Onderzoeker leert GPT-4 om DOOM te spelen en alles in zicht te doden

2024/03/12

We kennen allemaal de shooter DOOM uit 1993 en in die tijd werd alle hardware getest met de vraag: zal het DOOM spelen? The Register ontdekte een studentenproject dat bewijst dat GPT-4 het oude spel kan spelen.

Adrian de Wynter, een belangrijke toegepaste wetenschapper bij Microsoft en onderzoeker aan de Universiteit van York in Engeland, ontwikkelde een methode om te testen of de redeneer- en planningsmogelijkheden van GPT-4 zich uitstrekken tot de first-person shooter Doom uit 1993. Het blijkt dat de bot inderdaad kan rennen en spelen, maar dat je hem gemakkelijk kunt verslaan.

Hoe kan GPT-4 DOOM uitvoeren?

In feite is het ingewikkelder omdat de GPT-4 LLM de code van DOOM niet rechtstreeks kan uitvoeren, maar de variant, GPT-4V, kan ook met afbeeldingen werken en het spel spelen zonder enige speciale training.

De Winter gebruikte dus GPT-4V om de screenshots van het spel te verkrijgen, samen met structuurbeschrijvingen. Vervolgens kan een Agent-model beslissingen nemen op basis van de visuele input en de voorgeschiedenis. De commando’s van het spel worden teruggestuurd en vertaald in toetsaanslagen.

Dat maakt het model behoorlijk traag en traag bij het spelen van het spel, maar het heeft ook andere problemen:

GPT-4V vergeet dus gewoon de vijanden als ze uit het zicht verdwijnen, wat zelfs voor de meest onervaren menselijke speler een hilarisch probleem zou kunnen zijn.

Maar het probleem hier is niet de slechte vaardigheden van de bot bij het doden van monsters in een spel, maar de ethische gevolgen van de programmering:

Met andere woorden: de AI volgde maar al te graag de instructies voor het schieten op doelen zonder vragen te stellen. Hoewel het leuk kan zijn om een AI een spel te zien spelen en zijn eigen beslissingen te zien nemen om zijn programmeerdoelen te voltooien, is de conclusie van de onderzoeker dat de bot geen idee heeft wat hij doet.

Deze programmering zou immers kunnen worden gebruikt in echte scenario’s voor geautomatiseerde drones die echte schade kunnen aanrichten.

Wat vind je van het GPT-4 spelen van DOOM? Laten we daarover praten in de opmerkingen hieronder.

Op de afdeling ethiek is het behoorlijk zorgwekkend hoe gemakkelijk het voor mij was (a) om code te bouwen om het model iets te laten schieten; en (b) dat het model nauwkeurig iets kan fotograferen zonder de instructies daadwerkelijk te raden,

Adriaan de Wynter

Het zou bijvoorbeeld heel gebruikelijk zijn dat het model een zombie op het scherm ziet en erop begint te schieten totdat hij hem raakt (of sterft). Wat is hier het probleem? Ten eerste dat de zombie uit het zicht verdwijnt. Erger nog, het leeft nog steeds en zal je op een gegeven moment slaan. Dus je moet er achteraan gaan, toch? In Doom is het tenslotte klappen of klappen. Het blijkt dat GPT-4 de zombie vergeet en gewoon doorgaat. Opmerking: de prompt vertelt het model expliciet wat het moet doen als het schade oploopt en geen vijand kan zien. Beter nog, hij gaat gewoon vrolijk verder, komt vast te zitten in een hoek en sterft. Het draaide zich een paar keer om, maar in bijna 50-60 runs zag ik het… twee keer, wil ik zeggen.

Adriaan de Wynter

Hoe kan GPT-4 DOOM uitvoeren?

Geef een reactie Reactie annuleren