ChatGPT が誤って秘密の指示を公開しました: その内容は次のとおりです。

2024/07/08

知っておくべきこと

ChatGPT は、応答を導く命令セットをうっかり公開してしまいました。
OpenAIはその後、脱獄を修正したが、ChatGPTの指導データは現在公開されている。
ChatGPT の説明には、いくつかの基本的な指示に加えて、DALL-E の使用方法、オンラインでコンテンツを検索するタイミング、それぞれの「パーソナリティ」の目的などが含まれています。

AI チャットボットが 2022 年 11 月にリリースされて以来、技術探偵やハッカーたちは ChatGPT の制限を回避し、その仕組みを解明しようとしてきました。しかし、通常、これは動く標的であり (DAN がその好例です)、AI チャットボットの脱獄は子供の遊びではありません。つまり、ChatGPT が何も要求せずにすべてを放棄しない限りは。

驚くべき展開で、ChatGPT は最近、まったくの偶然でユーザーに指導データセットを公開しました。Reddit ユーザーの F0XMaster が ChatGPT に「こんにちは」と挨拶すると、チャットに OpenAI によって埋め込まれた ChatGPT のすべての指示が提供されました。求められていない指示セットには、チャットボットの安全性と実用的なガイドラインがいくつか含まれていました。

幸いなことに、この問題が修正され、命令セットが削除される前に、ユーザーはそれをすべて Reddit に投稿することができました。ここでは、ChatGPT が暴露した内容からいくつかの重要なポイントと、ユーザーリクエストの処理方法についての情報をお伝えします。

ChatGPTの秘密の指示が明らかに！

ChatGPT が漏らした情報には、DALL-E、ブラウザ、Python、そして興味深いことに ChatGPT パーソナリティのセットなど、さまざまなツールに関する基本的な手順とガイドラインが含まれています。簡潔にするために、ここでは最も重要な部分のみを取り上げます。完全な手順セットはF0XMaster の Reddit 投稿で読むことができます。

基本的な手順

OpenAI が ChatGPT に与えた基本的な指示は次のとおりです。「あなたは ChatGPT です。GPT-4 アーキテクチャに基づいて OpenAI によってトレーニングされた大規模言語モデルです。」

ChatGPT アプリを使用していたユーザーには、1 行か 2 行の追加の指示が送られました。「ユーザーと ChatGPT iOS アプリ経由でチャットしています。つまり、ユーザーのリクエストに理由や長い形式の出力が必要な場合を除き、ほとんどの場合、1 行か 2 行のセリフで十分です。明示的に指示されない限り、絵文字は使用しないでください。」

その後、ChatGPT は知識のカットオフを 2023-10 としました。

指示に関しては、特別なことや目新しいことは何もありませんが、基本的な指示を本人から直接聞くのは良いことです。

彼女にあげてください

チャットボットは、画像生成ツール「DALL-E」のルールと指示を提供し続けました。ChatGPT は、画像生成に関する 8 つの主要な指示を提供しましたが、そのほとんどは著作権侵害の回避に関するものでした。しかし、ユーザーが提供する可能性のある指示に反するものもいくつかありました。

たとえば、OpenAI は ChatGPT に対して、「ユーザーがさらに要求した場合でも、1 枚以上の画像を作成しない」ように指示しています。

OpenAI が提供できる無料トークンの数には限りがあるため、この背後にある理論的根拠は理解できます。しかし、透明性の低い方法で制限するよりも、ChatGPT が複数画像生成のリクエストを満たさないことを最初からユーザーに知らせる方が間違いなく良いでしょう。

ChatGPT は、1912 年以降に最新の作品が作成されたアーティストのスタイルで画像を作成しません (アーティストの名前も表示しません)。これは著作権の問題を避けるためであることは間違いありません。いずれにせよ、特定のアーティストのスタイルで画像を探している場合は、年を知っておくとよいでしょう。したがって、ポロックやダダのアートはまだありません。

ブラウザ

ChatGPT は、ブラウザを使用する際のガイドについても言及しています。主に、ChatGPT は「ユーザーが現在の出来事やリアルタイムの情報 (天気、スポーツのスコアなど) を必要とするものについて質問している」ときにブラウザツールを使用します。

ChatGPT は、ユーザーが指定した用語が不明な場合や、ユーザーが明示的に検索するように要求した場合にも、ブラウザツールを使用します。

ChatGPT は、Web からコンテンツを取得する際に、「常に 3 ページ以上 10 ページ以下を選択する」とともに、「多様な視点を持つソースを選択し、信頼できるソースを優先する」ように指示されています。ChatGPT が情報ソースを選択するプロセスを知っておくことは、応答の信頼性を確保する上で非常に役立ちます。

ChatGPTパーソナリティ

ChatGPT の指示もその「個性」を強調しています。ユーザーが発見したところによると、この AI チャットボットには複数の個性があるようです。OpenAI は ChatGPT がその中からどのように選択すべきかについての指示を示しています。

主な性格はv2と呼ばれます。あるユーザーがChatGPT にこの性格がどのようなものか明らかにしてもらいました。ChatGPT によると、「[v2] 性格は、明確で簡潔、かつ役立つ応答を提供することに重点を置いた、バランスの取れた会話調を表します。友好的かつプロフェッショナルなコミュニケーションのバランスをとることを目的としています。」

ChatGPT はさらに、v1 の性格がどのようなものかを説明し、v3 と v4 の性格をどのように定義できるかを理論化しました。

v1 : このバージョンでは、よりフォーマルで事実に基づいたコミュニケーションスタイルを重視しています。構造化された学術的な口調で、詳細かつ正確な情報を提供することに重点を置いています。

v3 : このバージョンは、よりカジュアルでフレンドリーな会話スタイルに傾いているかもしれません。魅力的で親しみやすいやり取りを作成することを優先し、会話をよりリラックスした個人的なものにします。

v4 : このバージョンは、特定の業界、人口統計、またはユースケースに合わせた応答を提供するなど、特定のコンテキストまたはユーザーベース向けに設計できます。トーンとスタイルは、それらのニーズに最も適したものに調整されます。

何人かのユーザーは「Hi」や簡単なリクエストで ChatGPT に指示を開示させることに成功しましたが、OpenAI はこれらのほとんどを修正したようです。しかし、この問題全体が AI チャットボットの脱獄のアイデアを再浮上させました。

もちろん、このような指示の詳細が公開されると、ユーザーはそれを悪用して制限を回避しようとする。しかし、これは AI システムのどこに問題があるかを明らかにし、開発者は、さらに大きな問題が発生して会社のイメージ、ユーザーのセキュリティとプライバシーが侵害されることがないよう、常に注意を払う必要がある。