Gemini Live Review: Een verbeterde assistent die wordt gehinderd door zijn AI-model

Gemini Live Review: Een verbeterde assistent die wordt gehinderd door zijn AI-model

Wat u moet weten

  • Gemini Live is een indrukwekkende digitale assistent met een spraakmodusfunctie met 10 verschillende stemmen, snelle gespreksreacties en chattranscripties.
  • Helaas worden de reacties belemmerd door het onderliggende AI-model. De speech van Gemini Live kan ook wat te formeel zijn en de reacties voelen afgekapt aan.
  • Vertrouwen op Gemini Live is dwaas. Wat nog erger is, is er $20 voor betalen.

Gemini Live is beschikbaar via een Gemini Advanced-abonnement en is de meest besproken functie sinds de onthulling ervan op het Made by Google 2024-evenement, waardoor zelfs de lancering van de Pixel 9 tot een voetnoot is gereduceerd. Maar vroege recensies, hoewel aanvankelijk indrukwekkend, zijn niet in het voordeel ervan.

Dus besloot ik, net als de meeste tech-recensenten, Gemini Live zelf eens uit te proberen en te kijken waar het allemaal om draaide. Om het kort te houden, ga ik je niet alles vertellen waar ik het over had (wie heeft daar nou tijd voor?). Maar je krijgt wel een algemeen idee.

Gemini Live – Een geavanceerde digitale assistent met een beperking door zijn AI-model

Nu is Gemini Live niet gratis, en ik heb ook geen Pixel 9 die gratis een jaar lang een Gemini Advanced-abonnement heeft. Dus ik kreeg een gratis proefperiode en Gemini Live was meteen voor mij beschikbaar, wat gaaf is.

Zomaar!

Maar is het $20 abonnementsgeld voor Gemini Live het waard? Laten we dat eens uitzoeken.

Wat is er goed aan Gemini Live?

Gemini Live is beschikbaar in 10 stemmen, en u kunt eenvoudig de uwe kiezen in de instellingen van Gemini. Maar let op: Google vereist dat u Engels (Verenigde Staten) als standaard instelt om dit te kunnen doen, wat een gedachteloze vereiste is. Ik bedoel, er is een Britse stem (Capella) aanwezig.

Bedriegen mijn ogen mij?

Hoe dan ook, er zijn stemmen genoeg voor elke dag van de week, en nog veel meer.

Mijn eerste indruk van Gemini Live was, net als die van iedereen, positief. Gezien de stijve, synthetische stemmen van Google van vroeger, is Gemini Live een verademing. De stemmen zijn echter een beetje formeel – je hoort niet veel Umms en Ahs (en andere tussenwerpsels). Om deze reden, en om andere subliminale redenen, vond ik de stemmen een beetje onpartijdig en terughoudend, vermoedelijk zodat gebruikers geen emotionele banden zouden vormen – iets waarvan OpenAI vreest dat het het geval zou kunnen zijn met ChatGPT’s eigen Voice Mode, die nog steeds veel beter is.

De reacties komen snel, dus het voelt alsof je met een vriend op afroep praat. Maar in tegenstelling tot een vriend wiens verhalen nooit eindigen, kun je Gemini op elk moment onderbreken. Misschien wist je dat al. Maar het is toch de moeite waard om te vermelden, omdat je hem kunt vertellen om op te houden als hij iets begint te spuien waarvan je weet dat het niet klopt (hier later meer over).

Zodra je het gesprek beëindigt, vind je het transcript klaar en beschikbaar om te lezen. Voor mij is dit een van de beste functies. Het helpt echt om te kijken hoe het gesprek eruitziet in tekst en het te delen met anderen.

Ruimte voor verbetering

Er zijn dingen die Gemini Live goed doet. Maar het heeft ook veel onbenut potentieel.

Ten eerste zijn gesprekken met Gemini Live ongetwijfeld kort. Wanneer u een vraag stelt, zal Gemini Live zo min mogelijk woorden gebruiken, alsof het druk bezig is met het bedienen van andere mensen. U zult niet merken dat het zijdelings met u praat of met u spugballt, wat volgens velen een goede zaak is. Maar kunnen alle ideeën eenvoudig en to the point worden geformuleerd, ondanks Occam’s scheermes?

Ik vroeg het bijvoorbeeld om Pegasus (aangezien ik die stem gebruikte) te vergelijken met Icarus (beide onderdeel van Griekse mythen). Hoewel er verschillende knooppunten van vergelijking zijn, gaf Gemini Live me korte, to the point antwoorden. Ik bracht Hanuman (uit de hindoemythe) om het een andere hoek van vergelijking te geven. En opnieuw, niet meer dan een paar zinnen. Het werd frustrerend.

Na meerdere pogingen om het meer te laten zeggen, vroeg ik of er een instelling is waarmee ik de verbosity kan aanpassen. Het vertelde me dat het dat niet kon veranderen, maar gaf me heel autoritair instructies over hoe ik het zelf kon doen, wat ik dwaas genoeg volgde omdat er geen dergelijke instelling bestaat.

Wat? Waar?

En dat brengt mij bij…

Waar lijdt het onder?

Gemini’s neiging om dingen te verzinnen en te hallucineren heeft niet bepaald vertrouwen gewekt bij gebruikers. Het heeft ook veel kritiek gekregen vanwege de blunders bij het genereren van afbeeldingen in het verleden. Hoe ongelukkig het ook is, hoewel de modaliteit is veranderd en het onderliggende model is bijgewerkt naar Gemini 1.5 Flash, is het probleem nog steeds aanwezig op Gemini Live.

Hoewel de antwoorden voor het grootste gedeelte gebaseerd zijn op feitelijke informatie, komt het af en toe met een antwoord uit het niets.

Er valt zeker een argument te maken voor hoe het geven van een stem aan AI meer vertrouwen wekt bij gebruikers. En met menselijke stemmen is het veel gemakkelijker om je vertrouwen erin te stellen en je te laten beïnvloeden door het vertrouwen waarmee de antwoorden worden gepresenteerd. Maar als je niet op je hoede bent, of twijfelachtige antwoorden niet factcheckt, kun je jezelf voor de gek houden, net als ik.

De technologie ontwikkelt zich sneller dan iedereen had verwacht, maar chatbots zijn nog steeds net zo vatbaar voor hallucinaties als altijd. Dus zelfs als je weet dat AI geneigd is om slechte informatie te verstrekken, als je er blind op blijft vertrouwen, is het misschien niet zo dat je kunstmatige intelligentie nodig hebt.

Zeg het met mij mee: als je me één keer voor de gek houdt, zul je je schamen; als je me twee keer voor de gek houdt, zul je je schamen.

Hoe verhoudt Gemini Live zich tot de geavanceerde spraakmodus van ChatGPT?

Laten we nu eens kijken naar de olifant in de kamer. Hoe verhoudt Gemini Live zich tot ChatGPT’s Advanced Voice Mode? Eerlijk gezegd is Gemini Live gewoon niet zo breedsprakig, boeiend of vermakelijk als ChatGPT’s Voice Mode. Hoewel de laatste misschien een beetje te boeiend (zelfs flirterig) en griezelig menselijk was, met al zijn peinzende geluiden en maniertjes, dient het in ieder geval als een hulpmiddel om plezier mee te hebben. Gemini Live neemt zichzelf daarentegen te serieus, wat misschien niet in zijn voordeel werkt, vooral omdat zijn reacties worden belemmerd door zijn AI-model.

Maar het grootste verschil tussen de twee is misschien wel dit: Gemini Live interpreteert spraak als tekst en geeft vervolgens antwoord, terwijl de spraakmodus van ChatGPT spraak rechtstreeks verwerkt.

Uitspraak

Gemini Live is een prima tool en een duidelijke stap vooruit ten opzichte van de oude Google Assistent. De mogelijkheid om het vanaf het vergrendelscherm aan te roepen is handig en de 10 stemmen hebben genoeg te bieden. Maar het zou waanzin zijn om er voor iets professioneels op te vertrouwen. Persoonlijk zou ik mijn geld liever doneren aan een goed doel waar ik niets van weet dan $ 20 betalen voor alleen Gemini Live. Gelukkig heeft het Gemini Advanced-abonnement nog andere voordelen.

Zoals het er nu voorstaat, is het goed om AI, ongeacht de modaliteit, te zien als een herstellende schizofreen. Het wordt beter, maar het is nog steeds vatbaar voor terugvallen. Het enige verschil is dat je geen schizofreen in je zak hebt, en dat je er ook niet voor zult betalen.

Wat vind je van Gemini Live? Denk je dat Google deze lovende recensie zal afremmen? Laat het ons weten in de reacties hieronder.

Geef een reactie

Je e-mailadres wordt niet gepubliceerd. Vereiste velden zijn gemarkeerd met *