Gemini Live-Rezension: Ein verbesserter Assistent wird durch sein KI-Modell behindert
Was Sie wissen sollten
- Gemini Live ist eine beeindruckende Sprachmodusfunktion eines digitalen Assistenten mit 10 verschiedenen Stimmen, schnellen Gesprächsantworten und Chat-Transkripten.
- Leider werden die Antworten durch das zugrundeliegende KI-Modell behindert. Die Sprache von Gemini Live kann auch etwas zu formell sein und die Antworten wirken abgehackt.
- Sich auf Gemini Live zu verlassen ist dumm. Noch schlimmer ist es, 20 $ dafür zu bezahlen.
Gemini Live ist über ein Gemini Advanced-Abonnement erhältlich und ist seit seiner Vorstellung auf der Veranstaltung Made by Google 2024 die am meisten diskutierte Funktion. Sogar die Einführung des Pixel 9 war damit nur eine Fußnote. Die ersten Bewertungen sind zwar zunächst beeindruckend, sprechen jedoch nicht für das Feature.
Also beschloss ich, wie die meisten Technikkritiker, Gemini Live selbst auszuprobieren und mir anzusehen, worum es bei dem ganzen Kram geht. Der Kürze halber werde ich Ihnen nicht alles erzählen, worüber ich gesprochen habe (wer hat schon Zeit?). Aber Sie werden eine allgemeine Idee bekommen.
Gemini Live – Ein fortschrittlicher digitaler Assistent, der durch sein KI-Modell behindert wird
Nun, Gemini Live ist nicht kostenlos, und ich besitze auch kein Pixel 9, das mit einem einjährigen kostenlosen Gemini Advanced-Abonnement ausgestattet ist. Ich habe also eine kostenlose Testversion erhalten und Gemini Live war sofort für mich verfügbar, was toll ist.
Aber lohnt sich die Abonnementgebühr von 20 $ für Gemini Live? Lassen Sie es uns herausfinden.
Was ist das Gute an Gemini Live?
Gemini Live ist mit 10 Stimmen erhältlich und Sie können Ihre Stimme ganz einfach in den Gemini-Einstellungen auswählen. Beachten Sie jedoch, dass Sie bei Google als Standardeinstellung Englisch (USA) festlegen müssen, um dies tun zu können, was eine sinnlose Anforderung ist. Ich meine, es gibt doch eine britische Stimme (Capella).
So oder so, es gibt genug Stimmen für jeden Tag der Woche und noch mehr.
Mein erster Eindruck von Gemini Live war, wie der aller anderen auch, positiv. In Anbetracht der gestelzten, synthetischen Stimmen von Google von früher ist Gemini Live eine erfrischende Abwechslung. Die Stimmen sind allerdings ein wenig formell – man hört nicht viele Ähms und Ahs (und andere Interjektionen). Aus diesem und anderen unterschwelligen Gründen fand ich die Stimmen ein wenig leidenschaftslos und zurückhaltend, vermutlich, damit die Benutzer keine emotionalen Bindungen aufbauen – etwas, was OpenAI für den eigenen Sprachmodus von ChatGPT befürchtet, der immer noch viel besser ist.
Die Antworten kommen schnell, sodass es sich tatsächlich so anfühlt, als würden Sie mit einem Freund auf Abruf sprechen. Aber im Gegensatz zu einem Freund, dessen Geschichten niemals enden, können Sie Gemini jederzeit unterbrechen. Vielleicht wussten Sie das schon. Aber es ist trotzdem erwähnenswert, denn Sie können ihm sagen, dass er abschalten soll, wenn er anfängt, etwas zu sagen, von dem Sie wissen, dass es falsch ist (mehr dazu später).
Sobald Sie das Gespräch beenden, steht Ihnen das Transkript zum Lesen zur Verfügung. Für mich ist das eine der besten Funktionen. Es hilft wirklich, zu sehen, wie das Gespräch im Text aussieht, und es mit anderen zu teilen.
Raum für Verbesserungen
Es gibt Dinge, die Gemini Live gut macht. Aber es hat auch viel ungenutztes Potenzial.
Erstens sind Gespräche mit Gemini Live zweifellos kurz. Wenn Sie eine Frage stellen, antwortet Gemini Live mit so wenigen Worten wie möglich, als ob es damit beschäftigt wäre, sich um andere Leute zu kümmern. Sie werden nicht feststellen, dass es nebenbei redet oder Ihnen etwas vorwirft, was viele als eine gute Sache bezeichnen würden. Aber können alle Ideen einfach und auf den Punkt gebracht werden, ungeachtet von Ockhams Rasiermesser?
Ich habe es zum Beispiel gebeten, Pegasus (da ich diese Stimme verwendete) mit Ikarus (beide sind Teil der griechischen Mythologie) zu vergleichen. Obwohl es mehrere Vergleichspunkte gibt, gab mir Gemini Live kurze, auf den Punkt gebrachte Antworten. Ich habe Hanuman (aus der hinduistischen Mythologie) hinzugezogen, um einen weiteren Vergleichswinkel zu bieten. Und wieder nicht mehr als ein paar Sätze. Das Ganze wurde frustrierend.
Nach mehreren Versuchen, mehr zu sagen, fragte ich, ob es eine Einstellung gibt, mit der ich die Ausführlichkeit anpassen kann. Es wurde mir gesagt, dass es nicht möglich sei, dies zu ändern, gab mir aber sehr autoritär Anweisungen, wie ich es selbst tun könnte, die ich dummerweise befolgte, da es keine solche Einstellung gibt.
Was mich zu folgendem bringt …
Wo leidet es?
Geminis Neigung, Dinge zu erfinden und zu halluzinieren, hat bei den Benutzern nicht gerade für Vertrauen gesorgt. In der Vergangenheit hat es auch viel Kritik für seine Fehler bei der Bildgenerierung auf sich gezogen. So bedauerlich es auch ist, obwohl sich die Modalität geändert hat und das zugrunde liegende Modell auf Gemini 1.5 Flash aktualisiert wurde, ist das Problem bei Gemini Live immer noch weit verbreitet.
Obwohl die meisten seiner Antworten auf Fakten basieren, kommt es hin und wieder vor, dass eine Antwort aus heiterem Himmel generiert wird.
Es gibt sicherlich gute Argumente dafür, dass es das Vertrauen der Nutzer stärkt, wenn man der KI eine Stimme gibt. Und mit menschenähnlichen Stimmen ist es viel einfacher, ihr zu vertrauen und sich von der Zuversicht, mit der die Antworten präsentiert werden, beeinflussen zu lassen. Aber wenn Sie nicht auf der Hut sind oder zweifelhafte Antworten nicht auf ihren Wahrheitsgehalt überprüfen, werden Sie sich möglicherweise wie ich getäuscht fühlen.
Die Technologie entwickelt sich schneller als erwartet, aber Chatbots sind nach wie vor anfällig für Halluzinationen. Selbst wenn Sie also wissen, dass KI dazu neigt, falsche Informationen zu liefern, und weiterhin blind auf sie vertrauen, ist es vielleicht gar keine künstliche Intelligenz, die Sie brauchen.
Sagen Sie es mit mir: Wer mich einmal zum Narren hält, ist Schande über sich; wer mich zweimal zum Narren hält, ist Schande über mich.
Wie schneidet Gemini Live im Vergleich zum erweiterten Sprachmodus von ChatGPT ab?
Nun wollen wir uns dem Elefanten im Raum zuwenden. Wie schlägt sich Gemini Live im Vergleich zum erweiterten Sprachmodus von ChatGPT? Ehrlich gesagt ist Gemini Live einfach nicht so wortreich, fesselnd oder unterhaltsam wie der Sprachmodus von ChatGPT. Obwohl letzterer mit all seinen nachdenklichen Lauten und Manierismen vielleicht ein wenig zu fesselnd (sogar kokett) und unheimlich menschlich war, dient er zumindest als Werkzeug, mit dem man Spaß haben kann. Gemini Live hingegen nimmt sich selbst zu ernst, was ihm möglicherweise nicht zugute kommt, insbesondere da seine Antworten durch sein KI-Modell beeinträchtigt werden.
Der vielleicht größte Unterschied zwischen beiden besteht jedoch darin: Gemini Live interpretiert Sprache als Text und gibt dann seine Antwort, während der Sprachmodus von ChatGPT Sprache direkt verarbeitet.
Urteil
Gemini Live ist ein gutes Tool und eine klare Verbesserung gegenüber dem alten Google Assistant. Die Möglichkeit, es über den Sperrbildschirm aufzurufen, ist praktisch, und die 10 Stimmen haben genug zu bieten. Aber es wäre verrückt, sich bei professionellen Aufgaben darauf zu verlassen. Persönlich würde ich mein Geld lieber einer Wohltätigkeitsorganisation spenden, von der ich nichts weiß, als 20 Dollar allein für Gemini Live zu bezahlen. Glücklicherweise bietet das Gemini Advanced-Abonnement noch weitere Vorteile.
So wie die Dinge stehen, ist es gut, KI, unabhängig von ihrer Modalität, als genesenden Schizophrenen zu betrachten. Es geht ihr besser, aber sie ist immer noch anfällig für Rückfälle. Der einzige Unterschied ist, dass Sie keinen Schizophrenen in der Tasche haben und auch nicht dafür bezahlen werden, einen zu bekommen.
Was halten Sie von Gemini Live? Glauben Sie, dass Google diese begeisterte Kritik drosseln wird? Lassen Sie es uns in den Kommentaren unten wissen.
Schreibe einen Kommentar