Test de Gemini Live : un assistant amélioré entravé par son modèle d’IA

Test de Gemini Live : un assistant amélioré entravé par son modèle d’IA

Ce qu’il faut savoir

  • Gemini Live est une fonctionnalité impressionnante de mode vocal d’assistant numérique avec 10 voix différentes, des réponses conversationnelles rapides et des transcriptions de chat.
  • Malheureusement, ses réponses sont entravées par le modèle d’IA sous-jacent. Le discours de Gemini Live peut également être un peu trop formel et ses réponses semblent tronquées.
  • Il est insensé de se fier à Gemini Live. Le pire, c’est de payer 20 $ pour cela.

Disponible via un abonnement Gemini Advanced, Gemini Live est la fonctionnalité dont on parle le plus depuis son dévoilement lors de l’événement Made by Google 2024, reléguant même le lancement du Pixel 9 à une simple note de bas de page. Mais les premières critiques, bien qu’impressionnantes au départ, ne sont pas en sa faveur.

Comme la plupart des testeurs de technologie, j’ai décidé de tester Gemini Live moi-même et de voir de quoi il s’agissait. Par souci de concision, je ne vais pas vous raconter tout ce dont j’ai parlé (qui a le temps ?). Mais vous aurez une idée générale.

Gemini Live – Un assistant numérique avancé handicapé par son modèle d’IA

Gemini Live n’est pas gratuit, et je ne possède pas non plus de Pixel 9 fourni avec un abonnement Gemini Advanced gratuit d’un an. J’ai donc bénéficié d’un essai gratuit et Gemini Live était disponible immédiatement, ce qui est bien.

Comme ça!

Mais les 20 $ d’abonnement à Gemini Live en valent-ils la peine ? Découvrons-le.

Quels sont les avantages de Gemini Live ?

Gemini Live est disponible en 10 voix, et vous pouvez facilement choisir la vôtre dans les paramètres de Gemini. Mais notez que Google vous demande de définir l’anglais (États-Unis) comme langue par défaut pour pouvoir le faire, ce qui est une exigence inutile. Je veux dire, il y a une voix britannique (Capella) juste là.

Mes yeux me trompent-ils ?

Quoi qu’il en soit, il y a suffisamment de voix pour chaque jour de la semaine, et même plus.

Mes premières impressions sur Gemini Live, comme celles de tout le monde, ont été positives. Compte tenu des voix synthétiques et guindées de Google, Gemini Live est une bouffée d’air frais. Les voix sont cependant un peu trop formelles : vous n’entendrez pas beaucoup de « hum » et de « ah » (et autres interjections). Pour cette raison, et pour d’autres raisons subliminales, j’ai trouvé les voix un peu froides et retenues, sans doute pour que les utilisateurs ne finissent pas par former des liens émotionnels – ce qui pourrait être le cas, selon OpenAI, du mode vocal de ChatGPT, qui est encore bien meilleur.

Les réponses sont rapides, ce qui donne l’impression de parler à un ami au téléphone. Mais contrairement à un ami dont les histoires ne finissent jamais, vous pouvez interrompre Gemini à tout moment. Vous le saviez peut-être déjà. Mais cela vaut quand même la peine de le mentionner, car vous pouvez lui dire de se barrer s’il commence à dire quelque chose que vous savez être incorrect (nous y reviendrons plus tard).

Dès que vous aurez terminé la conversation, vous trouverez la transcription prête et disponible pour que vous puissiez la lire. Pour moi, c’est l’une des meilleures fonctionnalités. Cela aide vraiment à vérifier à quoi ressemble la conversation sous forme de texte et à la partager avec d’autres.

Marge d’amélioration

Gemini Live fait bien certaines choses, mais recèle également un potentiel inexploité.

Tout d’abord, les conversations avec Gemini Live sont sans aucun doute brèves. Lorsque vous posez une question, Gemini Live répond en aussi peu de mots que possible, comme s’il était occupé à répondre aux besoins d’autres personnes. Vous ne le verrez pas parler de manière indirecte ou ruminer avec vous, ce qui, selon beaucoup, est une bonne chose. Mais toutes les idées peuvent-elles être exprimées simplement et de manière précise, malgré le rasoir d’Occam ?

Par exemple, je lui ai demandé de comparer Pégase (puisque j’utilisais cette voix) avec Icare (tous deux issus de mythes grecs). Bien qu’il y ait plusieurs points de comparaison, Gemini Live m’a donné des réponses brèves et pertinentes. J’ai fait appel à Hanuman (du mythe hindou) pour lui donner un autre angle de comparaison. Et encore une fois, pas plus de quelques phrases. Les choses sont devenues frustrantes.

Après plusieurs tentatives pour lui faire dire plus, j’ai demandé s’il existait un paramètre qui me permettait d’ajuster sa verbosité. Il m’a répondu qu’il n’était pas capable de changer cela, mais m’a donné très autoritairement des instructions sur la façon dont je pouvais le faire moi-même, que j’ai suivies bêtement car aucun paramètre de ce type n’existe.

Quoi ? Où ?

Ce qui m’amène à…

Où ça souffre ?

La tendance de Gemini à inventer des choses et à avoir des hallucinations n’a pas vraiment favorisé la confiance des utilisateurs. Il a également suscité de nombreuses critiques pour ses erreurs de génération d’images dans le passé. Aussi regrettable que cela puisse être, bien que la modalité ait changé et que le modèle sous-jacent ait été mis à jour vers Gemini 1.5 Flash, le problème est toujours présent sur Gemini Live.

Bien que la plupart de ses réponses soient basées sur des informations factuelles, il arrive de temps à autre qu’il génère une réponse à partir de rien.

Il y a sûrement des arguments pour dire que donner la parole à l’IA inspire davantage confiance aux utilisateurs. Et avec des voix humaines, il est beaucoup plus facile de lui faire confiance et de se laisser influencer par la confiance avec laquelle les réponses sont présentées. Mais si vous ne faites pas attention ou ne vérifiez pas les réponses douteuses, vous risquez de vous faire avoir, comme je l’ai été.

La technologie évolue plus vite que prévu, mais les chatbots sont toujours aussi enclins aux hallucinations. Ainsi, même en connaissant la propension de l’IA à fournir de mauvaises informations, si vous continuez à vous y fier aveuglément, ce n’est peut-être pas de l’intelligence artificielle dont vous avez besoin.

Dites-le avec moi : si vous me trompez une fois, vous aurez honte ; si vous me trompez deux fois, vous aurez honte.

En quoi Gemini Live se compare-t-il au mode vocal avancé de ChatGPT ?

Maintenant, examinons le problème. Comment Gemini Live se compare-t-il au mode vocal avancé de ChatGPT ? À vrai dire, Gemini Live n’est tout simplement pas aussi verbeux, engageant ou divertissant que le mode vocal de ChatGPT. Bien que ce dernier ait pu être un peu trop engageant (voire séduisant) et étrangement humain, avec tous ses sons et ses manières réfléchies, il sert au moins d’outil pour s’amuser. Gemini Live, en revanche, se prend trop au sérieux, ce qui peut ne pas jouer en sa faveur, d’autant plus que ses réponses sont handicapées par son modèle d’IA.

Mais la plus grande différence entre les deux est peut-être la suivante : Gemini Live interprète la parole comme du texte et donne ensuite sa réponse tandis que le mode vocal de ChatGPT traite la parole directement.

Verdict

Gemini Live est un outil très performant, qui représente une nette amélioration par rapport à l’ancien Google Assistant. La possibilité de l’invoquer depuis l’écran de verrouillage est pratique, et les 10 voix ont déjà de quoi faire l’affaire. Mais il serait insensé de s’y fier pour quoi que ce soit de professionnel. Personnellement, je préfère donner mon argent à une œuvre caritative dont je ne connais rien plutôt que de payer 20 $ pour Gemini Live seul. Heureusement, l’abonnement Gemini Advanced offre d’autres avantages.

Dans l’état actuel des choses, il est bon de considérer l’IA, quelle que soit sa modalité, comme un schizophrène en voie de guérison. Elle s’améliore, mais elle est toujours sujette aux rechutes. La seule différence est que vous n’avez pas de schizophrène dans votre poche et que vous ne paierez pas pour en avoir un.

Que pensez-vous de Gemini Live ? Pensez-vous que Google va étouffer cette critique élogieuse ? Faites-le nous savoir dans les commentaires ci-dessous.

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *