¿Qué son los complementos de ChatGPT y cómo funcionan?

2023/07/17

ChatGPT ha arrasado con el mundo en los últimos meses desde que se lanzó al público. De hecho, ¿han sido solo unos meses? El impacto que ha tenido hace que se sienta como si hubiera existido durante años.

Pero a pesar de todas sus virtudes, tenía un pequeño defecto que no era tan pequeño; no tuvo acceso a información reciente. La única información que tenía era hasta mediados de 2021. Pero OpenAI finalmente está comenzando a cambiar eso. No, no ha sido entrenado con datos más nuevos. Sin embargo, OpenAI finalmente está implementando soporte temprano para complementos en ChatGPT que le permiten conectarse a Internet, así como a algunos servicios de terceros.

¿Qué son los complementos de ChatGPT?

Los complementos son herramientas que han sido diseñadas específicamente para modelos de lenguaje. Mejoran las capacidades del chatbot y le permiten realizar tareas que antes eran imposibles. Por ejemplo, ahora puede recuperar información en tiempo real, como resultados deportivos, precios de acciones, realizar acciones en nombre de un usuario, como reservar vuelos, y recuperar información de la base de conocimientos, como documentos de la empresa, etc.

Desde el lanzamiento de ChatGPT, los complementos fueron el elemento más demandado por los usuarios, y OpenAI finalmente lo cumplió. Pero su lanzamiento será gradual e iterativo. Inicialmente, OpenAI solo ha lanzado algunos complementos de terceros y un par de complementos propios.

El acceso para los usuarios, así como para los desarrolladores que desean crear complementos, también está limitado actualmente. Además, como usuario final, el acceso solo se otorga a los usuarios de ChatGPT Plus en este momento, pero ChatGPT dice que planean expandir la implementación en el futuro.

El acceso solo se puede solicitar después de unirse a su lista de espera , lo que implica completar un pequeño cuestionario sobre por qué le gustaría acceder y si estaría dispuesto a proporcionar comentarios.

La lista de complementos de terceros incluye:

Expedia – Este complemento te permitirá planificar tu próximo viaje con ChatGPT, con información completa sobre disponibilidad y precio de hoteles, vuelos, etc.
FiscalNote : este complemento de ChatGPT le permitiría acceder a información y datos legales, políticos y normativos en tiempo real.
Instacart : utilice ChatGPT para pedir comestibles en tiendas de comestibles y supermercados cercanos.
KAYAK : usa KAYAK dentro de ChatGPT para encontrar autos, hoteles, alquileres, etc. dentro de tu presupuesto definido.
Compras de Klarna : busque y compare precios de varias tiendas en línea dentro de su conversación de ChatGPT.
Milo Family AI : el complemento para que los padres potencien la crianza.
OpenTable : obtenga recomendaciones de restaurantes y enlaces de reserva en los chats.
Compre en Shopify : busque productos de diferentes marcas.
Slack : use ChatGPT con Slack para agilizar la comunicación
Habla : obtén un tutor de idiomas impulsado por IA
Wolfram : obtenga ChatGPT para acceder a cálculos, conocimientos matemáticos, etc.
Zapier : use este complemento para interactuar con más de 5000 aplicaciones dentro de ChatGPT.

También hay dos complementos de OpenAI: Navegación (un navegador web) y un intérprete de código, y un complemento de código abierto, llamado Retriever. Todos los complementos se encuentran actualmente en la fase de prueba alfa.

¿Cómo funcionan estos complementos?

Según OpenAI, los complementos son «ojos y oídos» para modelos de lenguaje como ChatGPT. El hecho de los modelos de lenguaje es que solo pueden aprender de sus datos de entrenamiento y ese aprendizaje puede ser limitado. ChatGPT solo puede proporcionar instrucciones basadas en texto por sí mismo. Estos complementos pueden hacer que siga estas instrucciones, así como poner a disposición información que es demasiado reciente, demasiado personal o demasiado específica y que no se puede incluir en los datos de entrenamiento.

Pero surge un problema de seguridad cuando piensa en un modelo de IA que sigue instrucciones y realiza acciones en su nombre. Esa es la razón por la cual los complementos se implementan lentamente. OpenAI los está construyendo con la seguridad como su principio central y monitoreará su uso en el mundo real.

Echemos un vistazo a cómo funcionan algunos de estos modelos de complementos.

Hojeada

Este es el complemento que conecta ChatGPT a Internet y es uno de los dos complementos de OpenAI. El complemento utiliza la API de búsqueda de Bing de Microsoft en un giro de los acontecimientos no tan curioso; las dos compañías han tenido acuerdos desde hace años. Además de las inversiones iniciales, Microsoft ahora también usa la tecnología OpenAI para potenciar su nueva Bing AI.

El modelo no solo sabe cómo navegar por Internet, sino que también sabe cuándo navegar por Internet y cuándo no. Por ejemplo, cuando un usuario le pide a ChatGPT información sobre los Oscar 2023, busca con precisión la consulta en Internet. Pero cuando se le pregunta sobre los primeros Oscar que se han celebrado, no busca en Internet, porque esa información forma parte de sus datos de formación.

Por lo tanto, para que ChatGPT navegue por Internet, deberá seleccionar el modelo/complemento ‘Navegación’.

Ahora, cuando un usuario ingresa un mensaje que requiere que navegue por Internet, lo hará; el proceso llevará algún tiempo ya que el bot necesitará tiempo para familiarizarse con la información. Puede ver el flujo de acción de ChatGPT hasta que genera una respuesta expandiendo el mosaico ‘Navegando por la web…’.

Allí, puede ver qué consultas buscó, en qué enlaces hizo clic y cuándo está leyendo en tiempo real. Utiliza un navegador web basado en texto para que pueda ir más allá de los resultados de búsqueda y leer y navegar en los sitios web.

Una vez que ChatGPT esté al día con los eventos, le dará una respuesta en su modelo de lenguaje natural, como antes. Pero la respuesta incluirá citas cuando se genere con el modelo de Navegación. Al hacer clic en la cita, accederá al sitio web. Este aspecto particular es el mismo que Bing Chat AI.

Desde el punto de vista de la seguridad, el navegador basado en texto solo puede realizar solicitudes GET, lo que reduce ciertos riesgos. Por ejemplo, el modelo solo puede recuperar información de Internet, pero no puede realizar operaciones «transaccionales», como enviar un formulario.

Intérprete de código

El modelo Code Interpreter, el segundo complemento de OpenAI, proporciona a ChatGPT un intérprete de Python. También le proporciona algo de espacio en disco de corta duración.

La sesión está viva durante un solo chat, por lo que la próxima llamada puede construirse sobre una llamada anterior, pero hay un límite de tiempo superior. Además, Code Interpreter también admite la carga y descarga de archivos con los resultados.

Para mantenerlo seguro, OpenAI lo mantiene en un entorno de ejecución aislado y con firewall. El acceso a Internet también está deshabilitado para Code Interpreter. Según OpenAI, aunque este movimiento limita la funcionalidad del modelo, inicialmente sienten que es el movimiento correcto.

El modelo ‘Code Interpreter’ debe seleccionarse antes de iniciar la conversación.

Una vez que el usuario ingrese las indicaciones que requieren el uso del complemento Code Interpreter, ChatGPT comenzará a usarlo para realizar los cálculos requeridos. Al igual que con la navegación, el usuario puede ver el flujo de cálculos de ChatGPT haciendo clic en «Mostrar trabajo» y todos los pasos del cálculo serán visibles.

En las pruebas iniciales, OpenAI descubrió que este complemento es útil en ciertos escenarios. Éstas incluyen:

Resolviendo problemas matemáticos, tanto cuantitativos como cualitativos, que, francamente, los usuarios consideraban que ChatGPT era basura antes.
Hacer análisis y visualización de datos, lo que entusiasma a muchos usuarios.
Conversión de archivos entre formatos

OpenAI espera que los usuarios descubran tareas más útiles que Code Interpreter puede realizar a medida que lo prueban.

Complementos de terceros

El resto de los complementos se incluyen en el modelo de Complementos. Esto también incluye el complemento Retriever de código abierto de OpenAI que los desarrolladores podrán usar y 12 complementos de terceros.

Una vez que se selecciona el modelo de Complementos del menú desplegable, el usuario puede instalar los complementos deseados desde la tienda.

Así es como funcionarán los complementos en pocas palabras:

Una vez que los usuarios activen un complemento al instalarlo (no se activarán automáticamente) y comiencen la conversación, OpenAI inyectará una descripción compacta del complemento en ChatGPT en un mensaje. Este mensaje no es visible para los usuarios finales, pero incluirá la descripción, los puntos finales y los ejemplos del complemento. Entonces, hasta que elija usar un complemento en una conversación, ChatGPT no tendrá ningún conocimiento al respecto. Debes activar los plugins que quieras usar en cada conversación.

Ahora, puede enviar su consulta a ChatGPT. Si el bot considera relevante invocar el complemento, lo hará mediante una llamada a la API. En otras palabras, puede decidir por sí mismo si es necesario invocar un complemento.

Luego incluirá los resultados que obtiene del complemento en la respuesta que genera para usted.

Este es un ejemplo de cómo ChatGPT usa complementos de OpenTable, Wolfram e Instacart. Un usuario le pide a ChatGPT que le recomiende un restaurante vegano para el sábado y una receta vegana para el domingo. También le piden que calcule las calorías de la receta que recomienda usando Wolfram, así como que ordene los ingredientes de la receta de Instacart. El bot de IA hace exactamente eso.

Primero, utiliza OpenTable para recomendar un restaurante y un enlace para hacer una reserva.

Recomienda una receta vegana (lo que antes podía hacer) y luego calcula las calorías de la receta utilizando Wolfram.

Finalmente, agrega todos los ingredientes requeridos al carrito en Instacart y le presenta al usuario el enlace en el que el usuario simplemente puede hacer clic para completar el pedido.

Los complementos van a cambiar por completo la forma en que funcionará ChatGPT. La velocidad con la que la IA está progresando en los últimos meses hace que sea un momento igualmente aterrador y excelente para estar vivo, ¿no es así?

¿Qué son los complementos de ChatGPT?

¿Cómo funcionan estos complementos?

Hojeada

Intérprete de código

Complementos de terceros

Deja una respuesta Cancelar la respuesta