El modelo GPT-4o de OpenAI es todo lo que queríamos que fueran los asistentes de voz

El modelo GPT-4o de OpenAI es todo lo que queríamos que fueran los asistentes de voz

Qué saber

  • La actualización de primavera de OpenAI presentó GPT-4o, el nuevo modelo insignia de la compañía.
  • OpenAI también demostró un modo de voz mejorado, que es el asistente más emotivo y realista hasta el momento.
  • GPT-4o y su API estarán disponibles para todos los usuarios, mientras que el modo de voz solo se está implementando para los suscriptores Plus por ahora.
  • ChatGPT también lanzará pronto su aplicación de escritorio para Mac; Una aplicación para Windows estará disponible en algún momento de este año.

OpenAI ha vuelto a subir el listón. Aunque las noticias en el evento Spring Update no involucraron ninguna incursión en el territorio de los motores de búsqueda, OpenAI se ganó los corazones y las mentes de muchos con su nuevo modelo GPT-4o. Es rápido, ágil y con un modo de voz mejorado, se parece terriblemente al asistente de inteligencia artificial de la película Her de Spike Jonze de 2013.

Pero lo más importante es que se trata de un gran paso adelante en materia de asistentes de voz para smartphones, algo que ChatGPT quiere reclamar y para el que ahora también es ideal. Aquí encontrará todo lo que debe saber sobre GPT, las actualizaciones del modo de voz en ChatGPT y lo que implican para la industria.

El modelo GPT-4o hace que ChatGPT sea más ágil y emotivo que cualquier chatbot o asistente de IA

https://www.youtube.com/watch?v=vgYi3Wr7v_g

GPT-4o (‘o’ de omni) es el nuevo modelo insignia de la compañía y también el primer modelo que combina texto, visión y audio. Tiene inteligencia de nivel GPT-4, pero es más rápido y eficiente. En la versión anterior del modo de voz, que funcionaba con una combinación de tres modelos con distintos grados de inteligencia, se perdió gran parte de la inteligencia principal del nivel GPT-4. Aquí es donde GPT-4o es diferente.

GPT-4o es el primer modelo, entrenado de extremo a extremo en las tres modalidades de texto, visión y audio, para potenciar únicamente el modo de voz. Y eso nos muestra. En una de las demostraciones, la gente de OpenAI instaló ChatGPT en dos teléfonos para hablar entre ellos y cantar canciones.

https://www.youtube.com/watch?v=MirzFk_DSiI

Las respuestas de ChatGPT son lo suficientemente rápidas como para llegar en tiempo real. También puede hacer cosas como observar el tono, detectar estados emocionales a partir de voz y videos, dar consejos, ayudarlo a codificar, traducir en vivo, mientras hace que todo parezca una conversación humana íntima.

Durante el evento, ChatGPT dramatizó cuentos antes de dormir, cambió de voz en un instante y terminó con una canción.

https://www.youtube.com/watch?v=D9byh4MAsUQ

Estas son sólo algunas de las muchas cosas que ChatGPT puede hacer con el omnimodelo GPT-4, que ya está abriendo nuevos caminos. Al ser los primeros de su tipo, los futuros omnimodelos podrían cambiar por completo la forma en que chateamos con ChatGPT y nuestra relación con él.

¡GPT-4o es gratis para todos!

GPT-4o tampoco está reservado solo para miembros Plus. El hecho de que OpenAI actualice automáticamente a los usuarios gratuitos con GPT-4o eleva el listón para otros chatbots en todos los ámbitos. Esto resulta particularmente útil para los usuarios que desean reemplazar el Asistente de Google (o Gemini en estos días), para lo cual ChatGPT es perfectamente adecuado.

Ya existen formas y medios para que los usuarios de Android utilicen ChatGPT como su asistente digital. Algunos fabricantes, como Nothing, también te permiten agregar ChatGPT al mosaico de configuración rápida para un acceso más rápido al modo de voz. Pero un asistente oficial de ChatGPT bien podría ser el reemplazo que desean los usuarios.

Con el lanzamiento de una aplicación de escritorio oficial ChatGPT, ChatGPT bien podría ser su único asistente en todos los dispositivos. La aplicación ChatGPT para Windows llegará a finales de este año, mientras que pronto se lanzará una aplicación para Mac en las próximas semanas.

GPT-4o es un modelo más pequeño y eficiente

GPT-4o es el modelo más rápido y asequible hasta el momento, destronando al GPT-4 Turbo en varios frentes. Con inteligencia de nivel GPT-Turbo, se prevé que GPT-4o sea dos veces más rápido, aunque las pruebas en el mundo real aún deben confirmarlo. Pero también hay otras actualizaciones. Compare las características más destacadas a continuación:

Imagen: OpenAI

OpenAI también hace que GPT-4o esté disponible en las API de finalización de chat, asistentes y lotes, que los desarrolladores aprovecharán tan pronto como salga, especialmente porque los tokens API cuestan la mitad del precio de GPT-4 Turbo.

La velocidad del nuevo modelo de ChatGPT es particularmente útil en las traducciones en vivo, como lo demostró OpenAI, su función de voz funciona como un mediador externo entre personas que hablan diferentes idiomas.

https://www.youtube.com/watch?v=c2DFg53Zhvw

El nuevo modo de voz y vídeo parece una IA de película

Gracias al omnimodelo, ChatGPT tiene un cociente emocional mucho más amplio, ya que puede detectar estados emocionales con solo escuchar tu voz o mirar tus expresiones faciales. Pero además de tener ojos y oídos, es la voz la que añade ese elemento humano mágico y da la ilusión de que hay un fantasma en la máquina que parece haber capturado la imaginación de personas de todo el mundo.

Sam Altman lo llamó acertadamente «IA de las películas». Siguiendo el tono alegre y ligeramente coqueto de la demostración, no será sorprendente ver que la gente adopte más voluntariamente ChatGPT como su asistente en lugar de los tradicionales asistentes predeterminados que, francamente, ahora parecen anticuados. Pero antes de hacerse amigo de ChatGPT o intimar con su compañero digital, tal vez preste atención al mensaje de la película a la que alude Altman y evite los peligros de confundir la compañía digital con la real.

¿Apple se asociará con OpenAI y reemplazará a Siri?

Sólo unos días antes del evento, se informó que Apple estaba cerca de llegar a un acuerdo con OpenAI para impulsar nuevas funciones de IA en futuros iPhones. Ahora que GPT-4o está disponible con un modo de voz mejor y más evocador, es posible que veamos que las capacidades de ChatGPT se trasladan a una serie de funciones de iOS, incluida Siri. Puede ser exagerado imaginar que Apple se deshaga de Siri en el corto plazo, si es que alguna vez lo hace. Pero bien podría actualizarse con capacidades no muy diferentes de las que ofrece ChatGPT. Se espera que haya más noticias sobre esto a medida que nos acercamos a la WWDC en junio. Así que estad atentos a eso.

¿Cuándo se lanzará GPT-4o?

GPT-4o, que se anunció recientemente, puede tardar un tiempo en implementarse para los usuarios de todo el mundo. En cuanto al alegre modo de voz, los suscriptores de Plus serán los primeros en acceder a él. Entonces, si desea probar la nueva función, chatear por más tiempo y obtener respuestas rápidas del asistente de IA, aún vale la pena tener una membresía Plus.

Con una arquitectura mejor y más rápida y una gama más amplia de capacidades emotivas, ChatGPT está perfectamente posicionado para convertirse en su asistente de voz favorito, tal vez incluso en un amigo.

¿Cuáles son tus pensamientos? ¿Estás emocionado de probar ChatGPT como tu asistente digital? Las posibilidades de conversaciones creativas son infinitas, pero también lo es el potencial de uso indebido. Entonces, incluso cuando pruebe las nuevas funciones, recuerde usarlas ante todo como una herramienta. ¡Hasta la proxima vez! Mantenerse seguro.

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *