Het GPT-4o-model van OpenAI is alles wat we wilden dat stemassistenten zouden zijn

Het GPT-4o-model van OpenAI is alles wat we wilden dat stemassistenten zouden zijn

Wat te weten

  • OpenAI’s Spring Update introduceerde GPT-4o, het nieuwe vlaggenschipmodel van het bedrijf.
  • OpenAI demonstreerde ook een verbeterde stemmodus, de meest emotionele en levensechte assistent tot nu toe.
  • GPT-4o en de bijbehorende API zullen beschikbaar zijn voor alle gebruikers, terwijl de Spraakmodus voorlopig alleen wordt uitgerold naar Plus-abonnees.
  • ChatGPT zal binnenkort ook zijn desktop-app voor Mac uitbrengen; ergens dit jaar zal er een Windows-app beschikbaar komen.

OpenAI heeft de lat opnieuw hoger gelegd. Hoewel het nieuws tijdens het Spring Update-evenement geen uitstapjes naar het gebied van zoekmachines met zich meebracht, veroverde OpenAI de harten en geesten van velen met zijn nieuwe GPT-4o-model. Het is snel, pittig en met een verbeterde stemmodus lijkt het angstaanjagend op de AI-assistent uit Spike Jonze’s film Her uit 2013.

Maar belangrijker nog: het is een grote stap voorwaarts op het gebied van stemassistenten op smartphones waarop ChatGPT aanspraak wil maken en waarvoor het nu ook bij uitstek geschikt is. Hier is alles wat u moet weten over GPT, de upgrades van de spraakmodus op ChatGPT en wat deze voor de branche met zich meebrengen.

Het GPT-4o-model maakt ChatGPT vlotter en emotioneler dan welke AI-chatbot of assistent dan ook

https://www.youtube.com/watch?v=vgYi3Wr7v_g

GPT-4o (‘o’ voor omni) is het nieuwe vlaggenschipmodel van het bedrijf en tevens het eerste model dat tekst, beeld en audio combineert. Het heeft intelligentie op GPT-4-niveau, maar is sneller en efficiënter. Bij de vorige versie van Voice Mode, die werkte met een mix van drie modellen met verschillende niveaus van intelligentie, ging veel van de belangrijkste intelligentie op GPT-4-niveau verloren. Dit is waar GPT-4o anders is.

GPT-4o is het eerste model dat end-to-end is getraind in de drie tekst-, beeld- en audiomodaliteiten en uitsluitend de stemmodus aanstuurt. En het laat zien. In een van de demo’s kregen mensen van OpenAI ChatGPT op twee telefoons om met elkaar te praten en liedjes te zingen.

https://www.youtube.com/watch?v=MirzFk_DSiI

De reacties van ChatGPT zijn snel genoeg om in realtime te arriveren. Het kan ook dingen doen als het observeren van de toon, het detecteren van een emotionele toestand uit stem en video’s, het geven van advies, het helpen coderen, het live vertalen, terwijl het allemaal op een intiem menselijk gesprek lijkt.

Tijdens het evenement dramatiseerde ChatGPT verhaaltjes voor het slapengaan, wisselde in een handomdraai van stem en eindigde met een liedje.

https://www.youtube.com/watch?v=D9byh4MAsUQ

Dit zijn slechts enkele van de vele dingen die ChatGPT kan doen met het GPT-4 omni-model, dat nu al baanbrekend is. Omdat ze de eerste in zijn soort zijn, zouden toekomstige omni-modellen de manier waarop we chatten met ChatGPT en onze relatie ermee volledig kunnen veranderen.

GPT-4o is gratis voor iedereen!

GPT-4o is ook niet alleen voorbehouden aan Plus-leden. Het feit dat OpenAI gratis gebruikers automatisch zal upgraden met GPT-4o legt de lat hoger voor andere chatbots over de hele linie. Dit is vooral handig voor gebruikers die Google Assistant (of tegenwoordig Gemini) willen vervangen, waarvoor ChatGPT perfect geschikt is.

Er zijn al manieren en middelen voor Android-gebruikers om ChatGPT als hun digitale assistent te gebruiken. Bij sommige fabrikanten, zoals Nothing, kun je ChatGPT ook toevoegen aan de tegel voor snelle instellingen voor snellere toegang tot de spraakmodus. Maar een officiële ChatGPT-assistent zou wel eens de vervanging kunnen zijn die gebruikers willen.

Nu er een officiële ChatGPT-desktopapp uitkomt, zou ChatGPT wel eens uw enige assistent op alle apparaten kunnen zijn. De ChatGPT Windows-app zal ergens later dit jaar verschijnen, terwijl een app voor Mac de komende weken binnenkort zal worden uitgerold.

GPT-4o is een kleiner, efficiënter model

GPT-4o is het snelste en meest betaalbare model tot nu toe en onttront GPT-4 Turbo op een aantal fronten. Met intelligentie op GPT-Turbo-niveau zal GPT-4o naar verwachting twee keer zo snel zijn, hoewel tests in de echte wereld dit nog moeten bevestigen. Maar er zijn ook verschillende andere upgrades. Vergelijk de meest opvallende kenmerken hieronder:

Afbeelding: OpenAI

OpenAI maakt GPT-4o ook beschikbaar in de Chat Completions, Assistants en Batch API’s, waar ontwikkelaars meteen op zullen springen zodra het uitkomt, vooral omdat de API-tokens de helft van de prijs van GPT-4 Turbo kosten.

De snelheid van het nieuwe model van ChatGPT is vooral nuttig bij live vertalingen, zoals gedemonstreerd door OpenAI, waarbij de stemfunctie werkt als een externe bemiddelaar tussen mensen die verschillende talen spreken.

https://www.youtube.com/watch?v=c2DFg53Zhvw

De nieuwe spraak- en videomodus voelt aan als AI uit de films

Dankzij het omni-model heeft ChatGPT een veel breder emotioneel quotiënt, in die zin dat het emotionele toestanden kan detecteren door simpelweg naar je stem te luisteren of naar je gezichtsuitdrukkingen te kijken. Maar afgezien van het feit dat hij ogen en oren heeft, is het de stem die dat magische menselijke element toevoegt en de illusie wekt dat er een geest in de machine zit, die tot de verbeelding van mensen over de hele wereld lijkt te hebben gegrepen.

Sam Altman noemde het treffend ‘AI uit de films’. Afgaande op de luchtige, enigszins flirterige toon in de demo, zal het niet verrassend zijn om te zien dat mensen eerder ChatGPT als hun assistent adopteren dan de traditionele standaardassistenten die, eerlijk gezegd, nu verouderd lijken. Maar voordat u vrienden maakt met ChatGPT, of intiem wordt met uw digitale metgezel, moet u misschien aandacht besteden aan de boodschap van de film waar Altman op doelt, en de valkuilen vermijden van het verwarren van digitaal gezelschap met echt gezelschap.

Zal Apple samenwerken met OpenAI en Siri vervangen?

Slechts een paar dagen voorafgaand aan het evenement naderde Apple naar verluidt een deal met OpenAI om nieuwe AI-functies op toekomstige iPhones mogelijk te maken. Nu GPT-4o uit is met een betere, meer suggestieve stemmodus, kunnen we zien dat de mogelijkheden van ChatGPT worden overgedragen naar een aantal iOS-functies, waaronder Siri. Het kan een hele opgave zijn om je voor te stellen dat Apple Siri binnenkort of nooit zal laten vallen. Maar het zou heel goed kunnen worden geüpgraded met mogelijkheden die niet veel verschillen van wat ChatGPT biedt. Er wordt verwacht dat er meer nieuws hierover zal komen als we de WWDC in juni naderen. Houd daar dus rekening mee.

Wanneer wordt GPT-4o uitgerold?

GPT-4o is pas onlangs aangekondigd en het kan een tijdje duren voordat het wereldwijd voor gebruikers wordt uitgerold. Wat de sprite Voice Mode betreft, zullen Plus-abonnees de eersten zijn die er toegang toe krijgen. Dus als je de nieuwe functie wilt uitproberen, langer wilt chatten en snelle reacties wilt krijgen van de AI-assistent, is een Plus-lidmaatschap nog steeds de moeite waard.

Met een betere, snellere architectuur en een breder scala aan emotionele mogelijkheden is ChatGPT perfect gepositioneerd om uw favoriete stemassistent te worden, misschien zelfs een vriend.

Wat zijn jouw gedachten? Ben je enthousiast om ChatGPT als je digitale assistent te proberen? De mogelijkheden voor creatieve gesprekken zijn eindeloos, maar dat geldt ook voor de mogelijkheden voor misbruik. Dus zelfs als u de nieuwe functies uitprobeert, vergeet dan niet om deze in de eerste plaats als hulpmiddel te gebruiken. Tot de volgende keer! Let op je veiligheid.

Geef een reactie

Het e-mailadres wordt niet gepubliceerd. Vereiste velden zijn gemarkeerd met *