Gemini 1.5 Pro ist da! Machen Sie sich bereit für die nächste Stufe der Audioerkennung
Alle großen Technologiegiganten arbeiten an KI-Modellen, und wo wir gerade dabei sind: Google scheint eine neue Version von Gemini herausgebracht zu haben.
Gemini 1.5 Pro wurde veröffentlicht und bietet einige interessante Funktionen. Sehen wir uns also die Neuerungen genauer an.
Gemini 1.5 Pro ist da, kommt mit einer Audioerkennungsfunktion
Google hat sein KI-Modell kürzlich aktualisiert und Gemini 1.5 Pro ist über die öffentliche Vorschau von Google AI Studio in mehr als 180 Ländern verfügbar, wie MSPowerUser schreibt .
Gemini verfügt jetzt über ein Kontextfenster mit 1 Million, das Entwicklern eine bessere Analyse und ein besseres Verständnis von Informationen ermöglicht.
Das ist noch nicht alles, diese Version verfügt auch über eine Audioerkennungsfunktion, sodass sie gesprochene Sprache verarbeiten kann. Der Dateiupload wird ebenfalls unterstützt, sodass Sie eine Audiodatei hochladen können und Gemini diese analysiert.
Dies haben die Entwickler zu dieser Funktion zu sagen:
Das Update bringt den Entwicklern außerdem mehr Kontrolle und Funktionalität und unterstützt auch Systemanweisungen, sodass Sie Rollen, Formate und Ziele einfach angeben können.
Schließlich steht der JSON-Modus zur Verfügung, der die strukturierte Datenextraktion aus Bildern und Texten ermöglicht. Derzeit wird cURL unterstützt, und den Entwicklern zufolge soll die Unterstützung für das Python SDK bald verfügbar sein.
Das ist jedoch noch nicht alles von Google. Es gibt auch Berichte, dass Gemini bald Wiedergabevorschläge für Gmail für Android bereitstellen wird. Bleiben Sie also dran.
Sie können die Aufzeichnung einer Vorlesung hochladen, beispielsweise die über 117.000 Token umfassende Vorlesung von Jeff Dean, und Gemini 1.5 Pro kann daraus ein Quiz mit Lösungsschlüssel machen.
Schreibe einen Kommentar