ChatGPT a accidentellement révélé ses instructions secrètes : voici ce qu’elles sont !

ChatGPT a accidentellement révélé ses instructions secrètes : voici ce qu’elles sont !

Ce qu’il faut savoir

  • ChatGPT a révélé par inadvertance les ensembles d’instructions qui guident sa réponse.
  • Bien qu’OpenAI ait depuis corrigé le jailbreak, les données pédagogiques de ChatGPT sont désormais accessibles au public.
  • En plus de quelques instructions de base, les instructions de ChatGPT incluent comment utiliser DALL-E, quand rechercher du contenu en ligne et à quoi sert chacune de ses « personnalités ».

Depuis le lancement du chatbot IA en novembre 2022, des détectives et des pirates informatiques tentent de contourner les restrictions de ChatGPT et de découvrir ce qui le fait fonctionner. Mais en général, il s’agit d’une cible mouvante (par exemple, DAN), et jailbreaker les chatbots IA n’est pas un jeu d’enfant. À moins que ChatGPT ne renonce à tout sans même le demander.

Dans une tournure surprenante des événements, ChatGPT a récemment révélé son ensemble de données d’instructions à un utilisateur de manière totalement accidentelle. En saluant ChatGPT d’un simple « Salut », l’utilisateur de Reddit F0XMaster a reçu toutes les instructions de ChatGPT, intégrées par OpenAI, dans le chat. L’ensemble d’instructions non sollicitées comprenait plusieurs consignes de sécurité et pratiques pour le chatbot.

Heureusement, avant que le problème ne soit résolu et que les instructions ne soient supprimées, l’utilisateur a réussi à publier le tout sur Reddit. Voici quelques points clés à retenir de tout ce que ChatGPT a divulgué et ce que cela nous apprend sur la façon dont il gère les demandes des utilisateurs.

Les instructions secrètes de ChatGPT révélées !

Les informations divulguées par ChatGPT incluent certaines de ses instructions et directives de base pour différents outils tels que DALL-E, un navigateur, Python et, curieusement, un ensemble de personnalités ChatGPT. Par souci de concision, nous ne soulignerons ici que les éléments les plus saillants. Vous pouvez lire l’ensemble des instructions complètes sur le post reddit de F0XMaster .

Instructions de base

Voici les instructions de base qu’OpenAI a données à ChatGPT : « Vous êtes ChatGPT, un grand modèle de langage formé par OpenAI, basé sur l’architecture GPT-4. »

Les personnes qui utilisaient l’application ChatGPT recevaient une ou deux lignes d’instructions supplémentaires : « Vous discutez avec l’utilisateur via l’application iOS ChatGPT. Cela signifie que la plupart du temps, vos lignes doivent être constituées d’une ou deux phrases, à moins que la demande de l’utilisateur ne nécessite un raisonnement ou des résultats longs. N’utilisez jamais d’émojis, sauf si on vous le demande explicitement. »

Par la suite, ChatGPT a fourni sa date limite de connaissances : 2023-10.

Bien qu’il n’y ait rien de spécial ou de révélateur ici en termes d’instructions, il est toujours bon d’obtenir les instructions de base directement de la bouche du cheval.

LUI DONNER

Le chatbot a ensuite fourni les règles et instructions pour son générateur d’images – DALL-E. ChatGPT a donné huit instructions principales pour la génération d’images, dont la plupart visent à éviter les violations du droit d’auteur. Mais certaines d’entre elles vont à l’encontre des instructions rapides qu’un utilisateur pourrait fournir.

Par exemple, OpenAI demande à ChatGPT de « ne pas créer plus d’une image, même si l’utilisateur en demande plus ».

La logique derrière cela est compréhensible, car OpenAI ne peut fournir qu’un nombre limité de jetons gratuits. Mais il est certainement préférable de faire savoir aux utilisateurs que ChatGPT ne répondra pas aux demandes de génération multi-images dès le départ, plutôt que de le restreindre d’une manière qui n’est pas très transparente.

ChatGPT ne crée pas non plus d’images dans le style des artistes (ni même ne les nomme) si leur dernière œuvre a été créée après 1912, sans doute pour éviter les problèmes de droits d’auteur. Dans tous les cas, il est bon de connaître l’année si vous recherchez des images dans le style d’un artiste en particulier. Donc pas encore d’art Pollock ou Dada.

Navigateur

ChatGPT a également mentionné les instructions qui le guident lorsqu’il utilise le navigateur. ChatGPT utilise principalement l’outil du navigateur lorsque « l’utilisateur pose une question sur l’actualité ou quelque chose qui nécessite des informations en temps réel (météo, résultats sportifs, etc.) ».

ChatGPT utilise également l’outil de navigateur lorsqu’il n’est pas sûr des termes fournis par l’utilisateur et si l’utilisateur lui demande de rechercher des éléments explicitement.

Lors de la récupération de contenu sur le Web, ChatGPT est invité à « toujours sélectionner au moins 3 et au plus 10 pages » ainsi qu’à « sélectionner des sources aux perspectives diverses et à privilégier des sources fiables ». Il est utile de connaître le processus par lequel ChatGPT sélectionne ses sources d’informations, car cela contribue grandement à garantir que les réponses restent fiables.

Personnalité de ChatGPT

Les instructions de ChatGPT mettent également en évidence sa « personnalité ». D’après ce que les utilisateurs ont découvert, il semble que le chatbot IA en possède plusieurs. OpenAI a défini les directives sur la manière dont ChatGPT doit choisir parmi elles.

La personnalité principale est appelée v2 . Un utilisateur a réussi à obtenir de ChatGPT qu’il divulgue à quoi ressemblait cette personnalité. Selon ChatGPT, « la personnalité [v2] représente un ton équilibré et conversationnel qui met l’accent sur la fourniture de réponses claires, concises et utiles. Elle vise à trouver un équilibre entre une communication amicale et professionnelle. »

ChatGPT a décrit plus en détail à quoi ressemble la personnalité v1 et a théorisé comment les personnalités v3 et v4 pourraient être définies :

v1 : Cette version privilégie un style de communication plus formel et factuel. Elle s’attache à fournir des informations détaillées et précises, souvent sur un ton structuré et académique.

v3 : Cette version pourrait s’orienter davantage vers un style de conversation décontracté et convivial. Elle privilégie la création d’une interaction engageante et accessible, rendant la conversation plus détendue et personnelle.

v4 : Cette version pourrait être conçue pour un contexte ou une base d’utilisateurs spécifique, par exemple pour fournir des réponses adaptées à un secteur d’activité, à un groupe démographique ou à un cas d’utilisation particulier. Le ton et le style seraient adaptés pour répondre au mieux à ces besoins.

Même si plusieurs utilisateurs ont réussi à faire en sorte que ChatGPT divulgue ses instructions avec un « Salut » ou une simple demande, il semble qu’OpenAI ait corrigé la plupart de ces problèmes. Pourtant, tout ce problème a fait resurgir l’idée de jailbreaker les chatbots IA.

Bien sûr, lorsque ces détails d’instructions sont rendus publics, les utilisateurs tentent de les exploiter pour contourner les restrictions. Mais cela met également en évidence les dysfonctionnements des systèmes d’IA et oblige les développeurs à rester sur leurs gardes, de peur que des problèmes encore plus graves ne surviennent et que l’image de l’entreprise, ainsi que la sécurité et la confidentialité des utilisateurs, ne soient compromises.

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *