研究者が GPT-4 に DOOM をプレイし、目に見えるものをすべて殺すように教えます

2024/03/12

1993 年のシューティングゲーム DOOM については誰もが知っていますが、当時、あらゆるハードウェアが「DOOM をプレイできるか?」という質問でテストされていました。The Register は、 GPT-4 が古いゲームをプレイできることを証明する学生プロジェクトを発見しました。

マイクロソフトの主任応用科学者であり、イギリスのヨーク大学の研究者であるエイドリアン・デ・ウィンターは、GPT-4 の推論と計画能力が 1993 年の一人称シューティングゲーム『Doom』にも拡張されるかどうかをテストする方法を開発しました。結局のところ、ボットは実行してプレイすることができますが、簡単に倒すことができます。

GPT-4 はどのようにして DOOM を実行できるのでしょうか?

実際、GPT-4 LLM は DOOM のコードを直接実行できないため、より複雑ですが、そのバリアントである GPT-4V は、特別なトレーニングなしで画像を操作してゲームをプレイすることもできます。

そこで、de Winter 氏は GPT-4V を使用して、ゲームのスクリーンショットと構造の説明を取得しました。その後、エージェントモデルは視覚的な入力と以前の履歴に基づいて意思決定を行うことができます。ゲームへのコマンドは送り返され、キーストロークに変換されます。

そのため、モデルの動作がかなり遅くなり、ゲームのプレイが遅くなりますが、他にも問題があります。

そのため、GPT-4V は敵が見えなくなると敵のことを忘れてしまいます。これは、最も経験の浅い人間のプレイヤーにとってさえ、面白い問題になる可能性があります。

しかし、ここでの問題は、ゲーム内でモンスターを倒すボットのスキルが低いということではなく、プログラミングの倫理的な影響です。

言い換えれば、AI は何も質問することなく、標的を撃つための指示に喜んで従ったということです。 AI がゲームをプレイし、プログラミングの目標を達成するために独自の決定を下すのを見るのは楽しいかもしれませんが、研究者の結論は、ボットは自分が何をしているのかまったくわからないということです。

結局のところ、このプログラミングは、実際の損害を引き起こす可能性のある自動ドローンの実際のシナリオで使用できる可能性があります。

GPT-4 が DOOM をプレイしていることについてどう思いますか?それについては、以下のコメントセクションで話しましょう。

倫理部門に関しては、(a) モデルに何かを撮影させるためのコードを構築することが私にとってどれほど簡単だったかは非常に心配です。 (b) モデルが実際に指示を後から推測せずに正確に撮影できるようにするため、

エイドリアン・デ・ウィンター

たとえば、モデルが画面上にゾンビを表示し、ゾンビに当たる (または死ぬ) まで発砲を開始することは非常に一般的です。ここで何が問題になっているのでしょうか？さて、まずゾンビが視界から消えます。さらに悪いことに、それはまだ生きており、いつかあなたを打ちのめすでしょう。だから、それを追いかけなければなりませんね？結局のところ、Doom では叩くか叩かれるかです。 GPT-4 はゾンビのことを忘れてそのまま進み続けることが判明しました。注: プロンプトは、モデルがダメージを受けていて敵が見えない場合に何をすべきかを明示的にモデルに指示します。さらに良いのは、ただ楽しく進んで隅に追い込まれて死んでしまうことです。何度か向きを変えましたが、50～60 回近くの実行で、私はそれを観察しました…言いたいのは 2 回です。

エイドリアン・デ・ウィンター

GPT-4 はどのようにして DOOM を実行できるのでしょうか?

コメントを残す コメントをキャンセル

コメントを残すコメントをキャンセル