Badacz uczy GPT-4 grać w DOOM i zabijać wszystko w zasięgu wzroku

2024/03/12

Wszyscy wiemy o strzelance DOOM z 1993 roku i w tamtym czasie każdy sprzęt był testowany pod kątem pytania: Czy zagra w DOOM? The Register zauważył projekt studencki, który potwierdza zdolność GPT-4 do grania w starą grę.

Adrian de Wynter, główny naukowiec stosowany w firmie Microsoft i badacz na Uniwersytecie w Yorku w Anglii, opracował metodę sprawdzania, czy możliwości GPT-4 w zakresie rozumowania i planowania rozciągają się na strzelankę pierwszoosobową Doom z 1993 roku. Jak się okazuje, tak, bot może na nim działać i grać, ale można go łatwo pokonać.

Jak GPT-4 może uruchomić DOOM-a?

W rzeczywistości jest to bardziej skomplikowane, ponieważ GPT-4 LLM nie może bezpośrednio uruchomić kodu DOOM-a, ale jego wariant, GPT-4V, może również pracować z obrazami i grać w grę bez specjalnego przeszkolenia.

Dlatego de Winter użył GPT-4V, aby uzyskać zrzuty ekranu z gry wraz z opisami struktur. Następnie model Agenta może podejmować decyzje w oparciu o dane wizualne i poprzednią historię. Polecenia do gry są odsyłane i tłumaczone na naciśnięcia klawiszy.

To sprawia, że model jest dość powolny i powolny w grze, ale ma też inne problemy:

Zatem GPT-4V po prostu zapomina o wrogach, jeśli znikną im z pola widzenia, co może być zabawnym problemem nawet dla najbardziej niedoświadczonego gracza.

Jednak problemem nie są słabe umiejętności bota w zabijaniu potworów w grze, ale etyczne konsekwencje programowania:

Innymi słowy, sztuczna inteligencja z radością postępowała zgodnie z instrukcjami dotyczącymi strzelania do celów, nie zadając żadnych pytań. Choć obserwowanie sztucznej inteligencji grającej w grę i podejmującej własne decyzje dotyczące realizacji celów programistycznych może być zabawne, badacz doszedł do wniosku, że bot nie ma pojęcia, co robi.

W końcu to oprogramowanie można wykorzystać w rzeczywistych scenariuszach w przypadku zautomatyzowanych dronów, które mogą wyrządzić realne szkody.

Co sądzisz o GPT-4 grającym w DOOM? Porozmawiajmy o tym w sekcji komentarzy poniżej.

Jeśli chodzi o dział etyki, dość niepokojące jest to, jak łatwo było (a) mi zbudować kod, dzięki któremu model coś strzelił; oraz (b) aby model mógł dokładnie strzelić do czegoś, bez faktycznego zgadywania instrukcji,

Adriana de Wyntera

Na przykład bardzo często model widziałby zombie na ekranie i zaczynał do niego strzelać, aż w niego uderzył (lub zginął). O co tutaj chodzi? Cóż, najpierw zombie zniknie z pola widzenia. Co gorsza, wciąż żyje i w pewnym momencie cię uderzy. Więc musisz się tym zająć, prawda? W końcu w Doom wszystko jest walnięte lub zostanie walnięte. Okazuje się, że GPT-4 zapomina o zombie i po prostu idzie dalej. Uwaga: zachęta wyraźnie mówi modelowi, co ma zrobić, jeśli otrzymuje obrażenia i nie widzi wroga. Co więcej, po prostu wyrusza swoją wesołą drogą, utknie w kącie i umiera. Kilka razy się odwrócił, ale w ciągu prawie 50–60 przejazdów zaobserwowałem to… dwa razy, chcę powiedzieć.

Adriana de Wyntera

Jak GPT-4 może uruchomić DOOM-a?

Dodaj komentarz Anuluj pisanie odpowiedzi