ChatGPT reveló accidentalmente sus instrucciones secretas: ¡Esto es lo que son!

2024/07/08

Qué saber

ChatGPT reveló inadvertidamente los conjuntos de instrucciones que guían su respuesta.
Aunque OpenAI ya ha solucionado el problema, los datos instructivos de ChatGPT ahora están a disposición del público.
Junto con algunas instrucciones básicas, las instrucciones de ChatGPT incluyen cómo usar DALL-E, cuándo buscar contenido en línea y para qué sirve cada una de sus «personalidades».

Desde que se lanzó el chatbot de IA en noviembre de 2022, los detectives tecnológicos y los piratas informáticos han estado tratando de eludir las restricciones de ChatGPT y descubrir qué es lo que lo hace funcionar. Pero, por lo general, este ha sido un objetivo en movimiento (por ejemplo, DAN), y desbloquear chatbots de IA no es un juego de niños. Es decir, a menos que ChatGPT lo entregue todo sin siquiera pedirlo.

En un sorprendente giro de los acontecimientos, ChatGPT reveló recientemente su conjunto de datos instructivos a un usuario por completo accidente. Al saludar a ChatGPT con un simple «Hola», el usuario de Reddit F0XMaster recibió todas las instrucciones de ChatGPT, incorporadas por OpenAI, en el chat. El conjunto de instrucciones no solicitadas incluía varias pautas prácticas y de seguridad para el chatbot.

Afortunadamente, antes de que se solucionara este problema y se eliminaran los conjuntos de instrucciones, el usuario logró publicarlo todo en Reddit. A continuación, se incluyen algunas conclusiones clave de todo lo que ChatGPT divulgó y lo que nos dice sobre la forma en que maneja las solicitudes de los usuarios.

¡Las instrucciones secretas de ChatGPT reveladas!

La información que ChatGPT ha dejado escapar incluye algunas de sus instrucciones y pautas básicas para diferentes herramientas como DALL-E, un navegador, Python y, curiosamente, un conjunto de personalidades de ChatGPT. Para abreviar, destacaremos aquí solo los fragmentos más destacados. Puedes leer el conjunto de instrucciones completo en la publicación de F0XMaster en Reddit .

Instrucciones básicas

Estas son las instrucciones básicas que OpenAI le ha dado a ChatGPT: “Eres ChatGPT, un gran modelo de lenguaje entrenado por OpenAI, basado en la arquitectura GPT-4”.

Quienes utilizaban la aplicación ChatGPT recibieron una o dos líneas adicionales de instrucciones: “Estás chateando con el usuario a través de la aplicación ChatGPT para iOS. Esto significa que la mayoría de las veces tus líneas deben ser una o dos oraciones, a menos que la solicitud del usuario requiera razonamiento o resultados extensos. Nunca uses emojis, a menos que se te pida explícitamente”.

Posteriormente, ChatGPT proporcionó su corte de conocimiento: 2023-10.

Aunque no hay nada especial ni revelador aquí en términos de instrucciones, aún así es bueno obtener las instrucciones básicas directamente de la fuente.

DARLE

El chatbot continuó proporcionando las reglas e instrucciones para su generador de imágenes: DALL-E. ChatGPT proporcionó ocho instrucciones principales para la generación de imágenes, la mayoría de las cuales tratan sobre cómo evitar infracciones de derechos de autor. Pero había un par que contradecían las instrucciones rápidas que un usuario podría proporcionar.

Por ejemplo, OpenAI ordena a ChatGPT “no crear más de una imagen, incluso si el usuario solicita más”.

La razón detrás de esto es comprensible, ya que OpenAI solo puede proporcionar una cierta cantidad de tokens gratuitos. Pero seguramente sea mejor informar a los usuarios que ChatGPT no cumplirá con las solicitudes de generación de múltiples imágenes desde el principio, en lugar de restringirlo de una manera que no sea muy transparente.

ChatGPT tampoco crea imágenes en el estilo de los artistas (ni siquiera los nombra) si su último trabajo fue creado después de 1912, sin duda para evitar problemas de derechos de autor. En cualquier caso, es bueno saber el año si estás buscando imágenes en el estilo de un artista en particular. Así que aún no hay arte de Pollock o Dada.

Navegador

ChatGPT también mencionó las instrucciones que lo guían cuando utiliza el navegador. Básicamente, ChatGPT utiliza la herramienta del navegador cuando el “usuario pregunta sobre eventos actuales o algo que requiere información en tiempo real (clima, resultados deportivos, etc.)”.

ChatGPT también utiliza la herramienta del navegador cuando no está seguro de los términos proporcionados por el usuario y si el usuario le pide que busque cosas explícitamente.

Al recuperar contenido de la web, ChatGPT recibe instrucciones de “seleccionar siempre al menos 3 y como máximo 10 páginas”, así como de “seleccionar fuentes con perspectivas diversas y preferir fuentes confiables”. Es bueno conocer el proceso mediante el cual ChatGPT selecciona sus fuentes de información, ya que contribuye en gran medida a garantizar que las respuestas sigan siendo confiables.

Personalidad de ChatGPT

Las instrucciones de ChatGPT también resaltan su «personalidad». Según lo que han descubierto los usuarios, parece que el chatbot de IA tiene varias de ellas. OpenAI ha establecido las directivas sobre cómo ChatGPT debería elegir entre ellas.

La personalidad principal se llama v2 . Un usuario logró que ChatGPT revelara cómo era esta personalidad. Según ChatGPT, “la personalidad [v2] representa un tono equilibrado y conversacional con énfasis en brindar respuestas claras, concisas y útiles. Su objetivo es lograr un equilibrio entre la comunicación amistosa y profesional”.

ChatGPT describió con más detalle cómo es la personalidad v1 y teorizó cómo se podrían definir las personalidades v3 y v4:

v1 : Esta versión enfatiza un estilo de comunicación más formal y factual. Se centra en brindar información detallada y precisa, a menudo en un tono estructurado y académico.

v3 : Esta versión puede inclinarse más hacia un estilo de conversación informal y amigable. Prioriza la creación de una interacción atractiva y accesible, lo que hace que la conversación se sienta más relajada y personal.

v4 : Esta versión podría diseñarse para un contexto o una base de usuarios específicos, como por ejemplo para brindar respuestas adaptadas a una industria, un grupo demográfico o un caso de uso en particular. El tono y el estilo se adaptarían para satisfacer mejor esas necesidades.

Aunque varios usuarios lograron que ChatGPT les diera instrucciones con un «Hola» o una simple solicitud, parece que OpenAI ha solucionado la mayoría de estos problemas. Sin embargo, todo el problema ha hecho resurgir la idea de desbloquear los chatbots de IA.

Por supuesto, cuando estos detalles instructivos se hacen públicos, los usuarios intentan aprovecharlos para eludir las restricciones, pero también ponen de relieve dónde se han equivocado los sistemas de IA y obligan a los desarrolladores a estar alerta para evitar que surjan problemas aún mayores y se comprometa la imagen de la empresa, junto con la seguridad y la privacidad de los usuarios.