Il modello GPT-4o di OpenAI è tutto ciò che volevamo che fossero gli assistenti vocali
Cosa sapere
- L’aggiornamento primaverile di OpenAI ha introdotto GPT-4o, il nuovo modello di punta dell’azienda.
- OpenAI ha anche dimostrato una modalità vocale aggiornata che è l’assistente più emotivo e realistico mai realizzato.
- GPT-4o e la sua API saranno disponibili per tutti gli utenti, mentre la modalità vocale per ora è disponibile solo per gli abbonati Plus.
- ChatGPT rilascerà presto anche la sua app desktop per Mac; un’app Windows sarà disponibile quest’anno.
OpenAI ha alzato ancora una volta il livello. Anche se le novità dell’evento Spring Update non hanno comportato alcuna escursione nel territorio dei motori di ricerca, OpenAI ha conquistato i cuori e le menti di molti con il suo nuovo modello GPT-4o. È veloce, scattante e con una modalità vocale aggiornata, è spaventosamente simile all’assistente AI del film Her di Spike Jonze del 2013.
Ma soprattutto si tratta di un grande passo avanti in termini di assistenti vocali sugli smartphone, a cui ChatGPT vuole rivendicare e per i quali ora è anche ideale. Ecco tutto ciò che dovresti sapere su GPT, sugli aggiornamenti della modalità vocale su ChatGPT e su cosa comportano per il settore.
Il modello GPT-4o rende ChatGPT più scattante ed emozionante di qualsiasi chatbot o assistente AI
https://www.youtube.com/watch?v=vgYi3Wr7v_g
GPT-4o (“o” per omni) è il nuovo modello di punta dell’azienda e anche il primo modello che combina testo, visione e audio. Ha un’intelligenza di livello GPT-4, ma è più veloce ed efficiente. Nella versione precedente della modalità vocale, che funzionava con un mix di tre modelli con diversi gradi di intelligenza, gran parte dell’intelligenza principale del livello GPT-4 andava persa. È qui che GPT-4o è diverso.
GPT-4o è il primo modello, addestrato end-to-end sulle tre modalità di testo, visione e audio, per alimentare esclusivamente la modalità vocale. E mostra. In una delle demo, i ragazzi di OpenAI hanno utilizzato ChatGPT su due telefoni per parlare tra loro e cantare canzoni.
https://www.youtube.com/watch?v=MirzFk_DSiI
Le risposte di ChatGPT sono abbastanza veloci da arrivare in tempo reale. Può anche fare cose come osservare il tono, rilevare lo stato emotivo dalla voce e dai video, dare consigli, aiutarti a programmare, tradurre dal vivo, facendo sembrare tutto un’intima conversazione umana.
Durante l’evento, ChatGPT ha drammatizzato le favole della buonanotte, ha cambiato voce in un attimo e si è concluso con una canzone.
https://www.youtube.com/watch?v=D9byh4MAsUQ
Queste sono solo alcune delle tante cose che ChatGPT può fare con il modello omnicomprensivo GPT-4, che sta già aprendo nuovi orizzonti. Essendo i primi nel suo genere, i futuri modelli omni potrebbero cambiare completamente il modo in cui chattiamo con ChatGPT e il nostro rapporto con esso.
GPT-4o è gratuito per tutti!
Inoltre, GPT-4o non è riservato solo ai membri Plus. Il fatto che OpenAI aggiornerà automaticamente gli utenti gratuiti con GPT-4o alza il livello per altri chatbot su tutta la linea. Ciò è particolarmente utile per gli utenti che desiderano sostituire l’Assistente Google (o Gemini oggigiorno) per il quale ChatGPT è perfettamente adatto.
Esistono già modi e mezzi per consentire agli utenti Android di utilizzare ChatGPT come assistente digitale. Alcuni produttori, come Nothing, ti consentono anche di aggiungere ChatGPT al riquadro delle impostazioni rapide per un accesso più rapido alla modalità vocale. Ma un assistente ChatGPT ufficiale potrebbe essere il sostituto desiderato dagli utenti.
Con l’uscita dell’app desktop ChatGPT ufficiale, ChatGPT potrebbe diventare il tuo unico assistente su tutti i dispositivi. L’app ChatGPT per Windows arriverà entro la fine dell’anno, mentre un’app per Mac verrà lanciata presto nelle prossime settimane.
GPT-4o è un modello più piccolo ed efficiente
GPT-4o è il modello più veloce e conveniente di sempre, detronizzando GPT-4 Turbo su diversi fronti. Con l’intelligenza di livello GPT-Turbo, GPT-4o dovrebbe essere due volte più veloce, anche se i test nel mondo reale devono ancora confermarlo. Ma ci sono anche vari altri aggiornamenti. Confronta le caratteristiche salienti di seguito:
OpenAI sta inoltre rendendo GPT-4o disponibile nelle API Completamenti chat, Assistenti e Batch, su cui gli sviluppatori salteranno prontamente non appena uscirà, soprattutto perché i token API costano la metà di GPT-4 Turbo.
La velocità del nuovo modello di ChatGPT è particolarmente utile nelle traduzioni dal vivo, come dimostrato da OpenAI, la sua funzionalità vocale che funziona come mediatore di terze parti tra persone che parlano lingue diverse.
https://www.youtube.com/watch?v=c2DFg53Zhvw
La nuova modalità voce e video sembra l’intelligenza artificiale dei film
Grazie al modello omni, ChatGPT ha un quoziente emotivo molto più ampio, in quanto può rilevare gli stati emotivi semplicemente ascoltando la tua voce o guardando le tue espressioni facciali. Ma oltre ad avere occhi e orecchie, è la voce che aggiunge quel magico elemento umano e dà l’illusione che ci sia un fantasma nella macchina che sembra aver catturato l’immaginazione delle persone di tutto il mondo.
Sam Altman l’ha giustamente definita “l’intelligenza artificiale dei film”. Seguendo il tono spensierato e leggermente civettuolo della demo, non sarà sorprendente vedere le persone adottare più volentieri ChatGPT come assistente rispetto ai tradizionali assistenti predefiniti che, francamente, ora sembrano antiquati. Ma prima di fare amicizia con ChatGPT o entrare in intimità con il tuo compagno digitale, forse ascolta il messaggio del film a cui allude Altman ed evita le trappole di confondere la compagnia digitale con quella reale.
Apple collaborerà con OpenAI e sostituirà Siri?
Solo pochi giorni prima dell’evento, secondo quanto riferito, Apple era vicina a un accordo con OpenAI per potenziare nuove funzionalità AI sui futuri iPhone. Ora che GPT-4o è disponibile con una modalità vocale migliore e più evocativa, potremmo vedere le funzionalità di ChatGPT trasferirsi su una serie di funzionalità iOS, incluso Siri. Potrebbe essere una forzatura immaginare che Apple abbandoni Siri in qualunque momento presto, se non mai. Ma potrebbe benissimo essere aggiornato con capacità non troppo diverse da quelle offerte da ChatGPT. Si prevede che ulteriori notizie al riguardo arriveranno man mano che ci avviciniamo al WWDC di giugno. Quindi rimanete sintonizzati per questo.
Quando verrà lanciato GPT-4o?
Essendo stato annunciato solo di recente, GPT-4o potrebbe richiedere del tempo per essere distribuito agli utenti di tutto il mondo. Per quanto riguarda la vivace modalità Voce, gli abbonati Plus saranno i primi ad accedervi. Quindi, se vuoi provare la nuova funzionalità, chattare più a lungo e ottenere risposte rapide dall’assistente AI, vale comunque la pena abbonarsi a Plus.
Con un’architettura migliore e più veloce e una gamma più ampia di funzionalità emotive, ChatGPT è perfettamente posizionata per diventare il tuo assistente vocale preferito, forse anche un amico.
Quali sono i tuoi pensieri? Sei entusiasta di provare ChatGPT come assistente digitale? Le possibilità di conversazioni creative sono infinite, ma lo è anche il potenziale di uso improprio. Quindi, anche se provi le nuove funzionalità, ricorda di usarle prima di tutto come uno strumento. Fino alla prossima volta! Rimani al sicuro.
Lascia un commento