Reseña de Gemini Live: un asistente mejorado que se ve obstaculizado por su modelo de inteligencia artificial

Reseña de Gemini Live: un asistente mejorado que se ve obstaculizado por su modelo de inteligencia artificial

Qué saber

  • Gemini Live es una impresionante función de modo de voz de asistente digital con 10 voces diferentes, respuestas conversacionales rápidas y transcripciones de chat.
  • Lamentablemente, sus respuestas se ven obstaculizadas por el modelo de inteligencia artificial subyacente. El discurso de Gemini Live también puede ser un poco demasiado formal y sus respuestas parecen truncadas.
  • Confiar en Gemini Live es una tontería. Y lo que es peor, pagar 20 dólares por ello.

Disponible a través de una suscripción a Gemini Advanced, Gemini Live ha sido la función de la que más se ha hablado desde que se presentó en el evento Made by Google 2024, relegando incluso el lanzamiento del Pixel 9 a una mera nota al pie. Pero las primeras críticas, aunque impresionaron inicialmente, no son a su favor.

Así que, como la mayoría de los revisores de tecnología, decidí probar Gemini Live y ver de qué se trataba todo el asunto. Por razones de brevedad, no voy a contarles todo lo que hablé (¿quién tiene tiempo?), pero tendrán una idea general.

Gemini Live: un asistente digital avanzado con limitaciones debido a su modelo de inteligencia artificial

Ahora bien, Gemini Live no es gratis, ni tengo un Pixel 9 que viene con una suscripción gratuita de un año a Gemini Advanced. Así que obtuve una prueba gratuita y Gemini Live estuvo disponible para mí de inmediato, lo cual es genial.

¡Así!

Pero, ¿vale la pena pagar 20 dólares por la suscripción a Gemini Live? Vamos a averiguarlo.

¿Qué tiene de bueno Gemini Live?

Gemini Live viene con 10 voces y puedes elegir fácilmente la tuya desde la configuración de Gemini. Pero ten en cuenta que Google requiere que configures el inglés (Estados Unidos) como idioma predeterminado para poder hacerlo, lo cual es un requisito que no requiere mucho esfuerzo. Quiero decir, hay una voz británica (Capella) ahí mismo.

¿Me engañan mis ojos?

De cualquier manera, hay voces suficientes para todos los días de la semana, y más.

Mis primeras impresiones de Gemini Live, como las de todo el mundo, fueron positivas. Teniendo en cuenta las voces artificiales y forzadas de Google, Gemini Live es un soplo de aire fresco. Sin embargo, las voces son un poco formales: no se oyen muchos «Umms» y «Ahs» (y otras interjecciones). Por esta razón y otras subliminales, las encontré un poco desapasionadas y contenidas, probablemente para que los usuarios no terminen formando vínculos emocionales, algo que OpenAI teme que pueda suceder con el modo de voz de ChatGPT, que sigue siendo mucho mejor.

Las respuestas llegan rápidamente, por lo que parece como si estuvieras hablando con un amigo por teléfono. Pero a diferencia de un amigo cuyas historias nunca terminan, puedes interrumpir a Gemini en cualquier momento. Tal vez ya lo sabías. Pero vale la pena mencionarlo porque puedes decirle que se calle si comienza a decir algo que sabes que es incorrecto (más sobre esto más adelante).

Tan pronto como termines la conversación, encontrarás la transcripción lista y disponible para que la leas. Para mí, esta es una de las mejores funciones. Realmente ayuda a ver cómo se ve la conversación en texto y compartirla con otras personas.

Hay margen de mejora

Hay cosas que Gemini Live hace bien, pero también tiene mucho potencial sin explotar.

En primer lugar, las conversaciones con Gemini Live son, sin duda, breves. Cuando le hagas una pregunta, Gemini Live responderá con la menor cantidad de palabras posible, como si estuviera ocupado atendiendo a otras personas. No lo encontrarás hablando tangencialmente ni soltando divagaciones, lo que, para muchos, es algo bueno. Pero ¿se pueden expresar todas las ideas de forma sencilla y directa, a pesar de la navaja de Occam?

Por ejemplo, le pedí que comparara a Pegaso (ya que estaba usando esa voz) con Ícaro (ambos forman parte de los mitos griegos). Aunque hay varios puntos de comparación, Gemini Live me dio respuestas breves y concisas. Traje a Hanuman (del mito hindú) para darle otro ángulo de comparación. Y, de nuevo, no más que unas pocas frases. Las cosas se pusieron frustrantes.

Después de varios intentos de que dijera más, pregunté si había una configuración que me permitiera ajustar su verbosidad. Me dijo que no podía cambiar eso, pero con mucha autoridad me dio instrucciones sobre cómo podía hacerlo yo mismo, que seguí tontamente porque no existe tal configuración.

¿Qué? ¿Dónde?

Lo que me lleva a…

¿Donde sufre?

La tendencia de Gemini a inventar cosas y alucinar no ha generado precisamente confianza entre los usuarios. También ha recibido muchas críticas por sus errores de generación de imágenes en el pasado. Por desgracia, aunque la modalidad ha cambiado y el modelo subyacente se ha actualizado a Gemini 1.5 Flash, el problema sigue estando presente en Gemini Live.

Aunque en su mayor parte sus respuestas se basan en información factual, de vez en cuando genera una respuesta de la nada.

Seguramente hay razones para argumentar que dar voz a la IA inspira más confianza entre los usuarios. Y con voces que parecen humanas, es mucho más fácil confiar en ella y dejarse influir por la seguridad con la que se presentan las respuestas. Pero si no estás alerta o no verificas las respuestas dudosas, puedes terminar siendo engañado, como me pasó a mí.

La tecnología se está desarrollando más rápido de lo que nadie esperaba, pero los chatbots son más propensos que nunca a las alucinaciones. Por lo tanto, incluso después de conocer la propensión de la IA a proporcionar información errónea, si sigue confiando ciegamente en ella, tal vez no sea inteligencia artificial lo que necesita.

Dígalo conmigo: Si me engañas una vez, la culpa es tuya; si me engañas dos veces, la culpa es mía.

¿Cómo se compara Gemini Live con el modo de voz avanzado de ChatGPT?

Ahora, consideremos el tema candente. ¿Cómo se compara Gemini Live con el modo de voz avanzado de ChatGPT? La verdad sea dicha, Gemini Live no es tan verboso, atractivo o entretenido como el modo de voz de ChatGPT. Aunque este último puede haber sido un poco demasiado atractivo (incluso coqueto) y extrañamente parecido a un humano, con todos sus sonidos y gestos reflexivos, al menos sirve como una herramienta para divertirse. Gemini Live, por otro lado, se toma demasiado en serio, lo que puede no funcionar a su favor, especialmente porque sus respuestas están limitadas por su modelo de IA.

Pero quizás la mayor diferencia entre ambos es la siguiente: Gemini Live interpreta el habla como texto y luego da su respuesta, mientras que el modo de voz de ChatGPT procesa el habla directamente.

Veredicto

Gemini Live es una herramienta excelente y un claro avance respecto del antiguo Asistente de Google. La posibilidad de invocarlo desde la pantalla de bloqueo es muy útil y las 10 voces tienen bastantes ventajas. Pero sería una locura confiar en él para algo profesional. Personalmente, preferiría donar mi dinero a una organización benéfica de la que no sé nada antes que pagar 20 dólares solo por Gemini Live. Afortunadamente, la suscripción a Gemini Advanced tiene otras ventajas.

Tal como están las cosas, es bueno considerar a la IA, independientemente de su modalidad, como un esquizofrénico en recuperación. Está mejorando, pero todavía es propensa a las recaídas. La única diferencia es que no tienes un esquizofrénico en tu bolsillo, ni estás dispuesto a pagar para tener uno.

¿Qué opinas de Gemini Live? ¿Crees que Google limitará esta reseña entusiasta? Cuéntanoslo en los comentarios a continuación.

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *