O modelo GPT-4o da OpenAI é tudo o que queríamos que os assistentes de voz fossem

O modelo GPT-4o da OpenAI é tudo o que queríamos que os assistentes de voz fossem

O que saber

  • A atualização de primavera da OpenAI apresentou o GPT-4o, o novo modelo carro-chefe da empresa.
  • A OpenAI também demonstrou um modo de voz atualizado, que é o assistente mais emotivo e realista até agora.
  • GPT-4o e sua API estarão disponíveis para todos os usuários, enquanto o modo de voz está sendo implementado apenas para assinantes Plus por enquanto.
  • ChatGPT também lançará em breve seu aplicativo de desktop para Mac; um aplicativo do Windows estará disponível ainda este ano.

OpenAI elevou a fasquia mais uma vez. Embora as notícias do evento Spring Update não envolvessem nenhuma excursão ao território dos mecanismos de busca, a OpenAI conquistou os corações e mentes de muitos com seu novo modelo GPT-4o. É rápido, ágil e com um modo de voz atualizado, é assustadoramente parecido com o assistente de IA do filme de 2013 de Spike Jonze, Her.

Mas o mais importante é que é um grande avanço em termos de assistentes de voz em smartphones que o ChatGPT deseja reivindicar e para os quais agora também é ideal. Aqui está tudo o que você deve saber sobre o GPT, as atualizações do modo de voz no ChatGPT e o que elas implicam para a indústria.

O modelo GPT-4o torna o ChatGPT mais ágil e emotivo do que qualquer chatbot ou assistente de IA

https://www.youtube.com/watch?v=vgYi3Wr7v_g

GPT-4o (‘o’ para omni) é o novo modelo carro-chefe da empresa e também o primeiro modelo que combina texto, visão e áudio. Possui inteligência de nível GPT-4, mas é mais rápido e eficiente. Na versão anterior do Modo Voz, que funcionava com uma mistura de três modelos com graus variados de inteligência, grande parte da inteligência principal do nível GPT-4 foi perdida. É aqui que o GPT-4o é diferente.

GPT-4o é o primeiro modelo, treinado de ponta a ponta nas três modalidades de texto, visão e áudio, para alimentar apenas o modo de voz. E isso mostra. Em uma das demonstrações, o pessoal da OpenAI colocou o ChatGPT em dois telefones para conversar e cantar músicas.

https://www.youtube.com/watch?v=MirzFk_DSiI

As respostas do ChatGPT são rápidas o suficiente para chegar em tempo real. Ele também pode fazer coisas como observar o tom, detectar o estado emocional de voz e vídeos, dar conselhos, ajudá-lo a codificar, traduzir ao vivo, ao mesmo tempo que faz com que tudo pareça uma conversa humana íntima.

Durante o evento, o ChatGPT dramatizou histórias para dormir, trocou de voz rapidamente e encerrou com uma música.

https://www.youtube.com/watch?v=D9byh4MAsUQ

Estas são apenas algumas das muitas coisas que o ChatGPT pode fazer com o modelo omni GPT-4, que já está abrindo novos caminhos. Sendo os primeiros deste tipo, os futuros modelos omni podem mudar completamente a forma como conversamos com o ChatGPT e a nossa relação com ele.

GPT-4o é gratuito para todos!

GPT-4o também não está reservado apenas para membros Plus. O fato de a OpenAI atualizar automaticamente os usuários gratuitos com GPT-4o eleva o padrão para outros chatbots em geral. Isso é particularmente útil para usuários que desejam substituir o Google Assistant (ou Gemini atualmente), para o qual o ChatGPT é perfeitamente adequado.

Já existem maneiras e meios para os usuários do Android usarem o ChatGPT como seu assistente digital. Alguns fabricantes, como Nothing, também permitem adicionar ChatGPT ao bloco de configuração rápida para acesso mais rápido ao modo de voz. Mas um assistente oficial do ChatGPT pode muito bem ser o substituto que os usuários desejam.

Com o lançamento de um aplicativo de desktop oficial do ChatGPT, o ChatGPT pode muito bem ser seu único assistente em todos os dispositivos. O aplicativo ChatGPT para Windows chegará ainda este ano, enquanto um aplicativo para Mac será lançado nas próximas semanas.

GPT-4o é um modelo menor e mais eficiente

O GPT-4o é o modelo mais rápido e acessível até agora, destronando o GPT-4 Turbo em diversas frentes. Com inteligência de nível GPT-Turbo, o GPT-4o está programado para ser duas vezes mais rápido, embora os testes no mundo real ainda não tenham confirmado isso. Mas também existem várias outras atualizações. Compare as características principais abaixo:

Imagem: OpenAI

A OpenAI também está disponibilizando o GPT-4o nas APIs de preenchimento de bate-papo, assistentes e lote, que os desenvolvedores irão prontamente utilizar assim que for lançado, especialmente porque os tokens da API custam metade do preço do GPT-4 Turbo.

A velocidade do novo modelo do ChatGPT é particularmente útil em traduções ao vivo, conforme demonstrado pela OpenAI, seu recurso de voz funcionando como um mediador terceirizado entre pessoas que falam idiomas diferentes.

https://www.youtube.com/watch?v=c2DFg53Zhvw

O novo modo de voz e vídeo parece IA de cinema

Graças ao modelo omni, o ChatGPT possui um quociente emocional muito mais amplo, na medida em que pode detectar estados emocionais apenas ouvindo sua voz ou olhando suas expressões faciais. Mas além de ter olhos e ouvidos, é a voz que acrescenta aquele elemento humano mágico e dá a ilusão de haver um fantasma na máquina que parece ter capturado a imaginação de pessoas em todo o mundo.

Sam Altman apropriadamente chamou isso de “IA do cinema”. Seguindo o tom alegre e levemente sedutor da demonstração, não será surpreendente ver as pessoas adotarem mais voluntariamente o ChatGPT como seu assistente em vez dos assistentes padrão tradicionais que, francamente, parecem antiquados agora. Mas antes de fazer amizade com o ChatGPT ou de se tornar íntimo de seu companheiro digital, talvez preste atenção à mensagem do filme a que Altman está aludindo e evite as armadilhas de confundir a companhia digital com a real.

A Apple fará parceria com a OpenAI para substituir a Siri?

Apenas alguns dias antes do evento, a Apple estava se aproximando de um acordo com a OpenAI para potencializar novos recursos de IA em futuros iPhones. Agora que o GPT-4o foi lançado com um modo de voz melhor e mais evocativo, podemos ver os recursos do ChatGPT sendo transferidos para uma série de recursos do iOS, incluindo o Siri. Pode ser um exagero imaginar a Apple abandonando a Siri tão cedo, ou nunca. Mas poderia muito bem ser atualizado com habilidades não muito diferentes das que o ChatGPT oferece. Espera-se que mais notícias sobre isso surjam à medida que nos aproximamos da WWDC em junho. Portanto, fique atento a isso.

Quando o GPT-4o será lançado?

Sendo anunciado recentemente, o GPT-4o pode demorar um pouco para ser implementado para usuários em todo o mundo. Quanto ao modo de voz animado, os assinantes do Plus serão os primeiros a acessá-lo. Portanto, se você quiser conferir o novo recurso, bater um papo por mais tempo e obter respostas rápidas do assistente de IA, uma assinatura Plus ainda vale a pena.

Com uma arquitetura melhor e mais rápida e uma gama mais ampla de recursos emotivos, o ChatGPT está perfeitamente posicionado para se tornar seu assistente de voz favorito, talvez até mesmo um amigo.

Quais são seus pensamentos? Você está animado para experimentar o ChatGPT como seu assistente digital? As possibilidades para conversas criativas são infinitas, mas também o é o potencial para uso indevido. Portanto, mesmo enquanto você experimenta os novos recursos, lembre-se de usá-los principalmente como uma ferramenta. Até a próxima vez! Fique seguro.

Deixe um comentário

O seu endereço de email não será publicado. Campos obrigatórios marcados com *