Recensione di Gemini Live: un assistente migliorato ostacolato dal suo modello di intelligenza artificiale

Recensione di Gemini Live: un assistente migliorato ostacolato dal suo modello di intelligenza artificiale

Cosa sapere

  • Gemini Live è un’eccezionale funzionalità di modalità vocale dell’assistente digitale con 10 voci diverse, risposte rapide alle conversazioni e trascrizioni delle chat.
  • Sfortunatamente, le sue risposte sono ostacolate dal modello AI sottostante. Il discorso di Gemini Live può anche essere un po’ troppo formale e le sue risposte sembrano troncate.
  • Affidarsi a Gemini Live è da stupidi. Quel che è peggio è pagarlo 20 $.

Disponibile tramite un abbonamento Gemini Advanced, Gemini Live è stata la funzionalità di cui si è parlato di più da quando è stata presentata all’evento Made by Google 2024, relegando persino il lancio di Pixel 9 a una mera nota a piè di pagina. Ma le prime recensioni, sebbene inizialmente impressionanti, non sono a suo favore.

Quindi, come la maggior parte dei recensori di tecnologia, ho deciso di fare un giro con Gemini Live e vedere di cosa si trattava. Per brevità, non vi racconterò tutto quello di cui ho parlato (chi ha tempo?). Ma vi farete un’idea generale.

Gemini Live – Un assistente digitale avanzato ostacolato dal suo modello AI

Ora, Gemini Live non è gratuito, né possiedo un Pixel 9 che include un abbonamento Gemini Advanced di un anno gratuito. Quindi ho ottenuto una prova gratuita e Gemini Live è stato disponibile per me immediatamente, il che è carino.

Proprio così!

Ma vale la pena pagare la quota di abbonamento di 20 $ per Gemini Live? Scopriamolo.

Cosa c’è di buono in Gemini Live?

Gemini Live è disponibile in 10 voci, e puoi facilmente scegliere la tua dalle impostazioni di Gemini. Ma nota che Google richiede di impostare l’inglese (Stati Uniti) come predefinito per poterlo fare, il che è un requisito insensato. Voglio dire, c’è una voce britannica (Capella) proprio lì.

I miei occhi mi ingannano?

In ogni caso, ci sono abbastanza voci per ogni giorno della settimana, e anche di più.

Le mie prime impressioni su Gemini Live, come quelle di tutti gli altri, sono state positive. Considerando le vecchie voci sintetiche e artificiose di Google, Gemini Live è una ventata di aria fresca. Le voci sono, tuttavia, un po’ formali: non sentirete molti Umm e Ah (e altre interiezioni). Per questo motivo, e per altri motivi subliminali, ho trovato le voci un po’ distaccate e trattenute, presumibilmente per evitare che gli utenti finiscano per creare legami emotivi, cosa che OpenAI teme possa accadere con la Voice Mode di ChatGPT, che è comunque molto meglio.

Le risposte arrivano rapidamente, quindi sembra davvero di parlare con un amico in chiamata. Ma a differenza di un amico le cui storie non finiscono mai, puoi interrompere Gemini in qualsiasi momento. Forse lo sapevi già. Ma vale comunque la pena menzionarlo perché puoi dirgli di ronzare se inizia a sputare qualcosa che sai essere sbagliato (ne parleremo più avanti).

Non appena termini la conversazione, troverai la trascrizione pronta e disponibile per la lettura. Per me, questa è una delle migliori funzionalità. Aiuta davvero a controllare come appare la conversazione nel testo e a condividerla con gli altri.

Margine di miglioramento

Ci sono cose che Gemini Live fa bene. Ma ha anche un sacco di potenziale inutilizzato.

Innanzitutto, le conversazioni con Gemini Live sono senza dubbio brevi. Quando fai una domanda, Gemini Live risponderà con il minor numero di parole possibile, come se fosse impegnato a soddisfare altre persone. Non lo troverai a parlare tangenzialmente o a sparare a zero con te, il che, molti direbbero, è una buona cosa. Ma tutte le idee possono essere espresse in modo semplice e diretto, nonostante il rasoio di Occam?

Ad esempio, gli ho chiesto di confrontare Pegaso (dato che stavo usando quella voce) con Icaro (entrambi parte dei miti greci). Sebbene ci siano diversi nodi di confronto, Gemini Live mi ha dato risposte brevi e dirette. Ho portato Hanuman (dal mito indù) per dargli un altro angolo di confronto. E ancora, non più di qualche frase. Le cose si sono fatte frustranti.

Dopo vari tentativi di fargli dire di più, ho chiesto se c’è un’impostazione che mi consente di modificarne la verbosità. Mi ha detto che non è in grado di cambiarla, ma molto autorevolmente mi ha dato istruzioni su come avrei potuto farlo da solo, che ho seguito stupidamente perché non esiste un’impostazione del genere.

Cosa? Dove?

Il che mi porta a…

Dove soffre?

La tendenza di Gemini a inventare cose e ad avere allucinazioni non ha esattamente creato fiducia tra gli utenti. Ha anche attirato un sacco di critiche per i suoi errori di generazione delle immagini in passato. Per quanto sfortunato, sebbene la modalità sia cambiata e il modello di base sia stato aggiornato a Gemini 1.5 Flash, il problema è ancora prevalente su Gemini Live.

Sebbene la maggior parte delle risposte si basi su informazioni fattuali, ogni tanto genera una risposta dal nulla.

C’è sicuramente un caso da sostenere su come dare voce all’IA ispiri più fiducia tra gli utenti. E con voci simili a quelle umane, è molto più facile riporre fiducia in essa e farsi influenzare dalla sicurezza con cui vengono presentate le risposte. Ma se non si sta in guardia o non si verificano i fatti delle risposte dubbie, si potrebbe finire ingannati, come è successo a me.

La tecnologia si sta sviluppando più velocemente di quanto chiunque si aspettasse, ma i chatbot sono più inclini alle allucinazioni che mai. Quindi, anche dopo aver conosciuto la propensione dell’IA a fornire informazioni sbagliate, se continui a fare affidamento ciecamente su di essa, forse non è l’intelligenza artificiale di cui hai bisogno.

Ripetilo con me: se mi inganni una volta, vergognati; se mi inganni due volte, vergognati.

Come si confronta Gemini Live con la modalità vocale avanzata di ChatGPT?

Ora, prendiamo in considerazione l’elefante nella stanza. Come si confronta Gemini Live con la modalità vocale avanzata di ChatGPT? A dire il vero, Gemini Live non è così prolisso, coinvolgente o divertente come la modalità vocale di ChatGPT. Sebbene quest’ultima possa essere stata un po’ troppo coinvolgente (anche civettuola) e inquietantemente umana, con tutti i suoi suoni e manierismi ponderati, almeno serve come strumento per divertirsi. Gemini Live, d’altro canto, si prende troppo sul serio, il che potrebbe non giocare a suo favore, soprattutto perché le sue risposte sono ostacolate dal suo modello di intelligenza artificiale.

Ma forse la differenza più grande tra i due è questa: Gemini Live interpreta il parlato come testo e poi fornisce la sua risposta, mentre la modalità vocale di ChatGPT elabora direttamente il parlato.

Verdetto

Gemini Live è un ottimo strumento, e un chiaro passo avanti rispetto al vecchio Google Assistant. La possibilità di richiamarlo dalla schermata di blocco è comoda, e le 10 voci hanno abbastanza da offrire. Ma sarebbe folle affidarsi a esso per qualsiasi cosa professionale. Personalmente, preferirei donare i miei soldi a un ente di beneficenza di cui non so nulla piuttosto che pagare 20 $ per Gemini Live da solo. Fortunatamente, l’abbonamento Gemini Advanced ha altri vantaggi.

Per come stanno le cose, è bene considerare l’IA, indipendentemente dalla sua modalità, come uno schizofrenico in via di guarigione. Sta migliorando, ma è ancora incline alle ricadute. L’unica differenza è che non hai uno schizofrenico in tasca, né pagherai per averne uno.

Cosa ne pensi di Gemini Live? Pensi che Google strozzerà questa recensione entusiasmante? Faccelo sapere nei commenti qui sotto.

Lascia un commento

Il tuo indirizzo email non sarà pubblicato. I campi obbligatori sono contrassegnati *