Gemini 1.5 Pro już jest! Przygotuj się na kolejny poziom rozpoznawania dźwięku

Gemini 1.5 Pro już jest! Przygotuj się na kolejny poziom rozpoznawania dźwięku

Wszyscy główni giganci technologiczni pracują nad modelami AI, a skoro już o tym mowa, wydaje się, że Google wypuściło nową wersję Gemini.

Gemini 1.5 Pro został wydany i oferuje kilka interesujących funkcji, więc zagłębmy się w niego i zobaczmy, co nowego.

Już jest Gemini 1.5 Pro z funkcją rozpoznawania dźwięku

Google zaktualizowało niedawno swój model AI, a Gemini 1.5 Pro jest dostępny w ponad 180 krajach w ramach publicznej wersji zapoznawczej Google AI Studio, jak pisze MSPowerUser .

Gemini ma teraz 1 milion okien kontekstowych, które pozwalają programistom lepiej analizować i rozumieć informacje.

To nie wszystko, ta wersja posiada również funkcję rozpoznawania dźwięku, dzięki czemu może przetwarzać język mówiony. Obsługiwane jest również przesyłanie plików, więc możesz przesłać plik audio, a Gemini go przeanalizuje.

Oto, co programiści mieli do powiedzenia na temat tej funkcji:

Aktualizacja zapewnia także programistom większą kontrolę i funkcjonalność, a także obsługuje instrukcje systemowe, dzięki czemu można łatwo określić role, formaty i cele.

Wreszcie dostępny jest tryb JSON, który umożliwia wyodrębnianie danych strukturalnych zarówno z obrazów, jak i tekstu. Według programistów obecnie obsługiwany jest cURL, a wkrótce pojawi się obsługa Python SDK.

To nie wszystko od Google, są też doniesienia, że ​​Gemini wkrótce wprowadzi sugestie powtórek do Gmaila na Androida, więc bądźcie czujni.

Możesz przesłać nagranie wykładu, na przykład ponad 117 000 żetonów wykładu Jeffa Deana, a Gemini 1.5 Pro może zamienić je w quiz z kluczem odpowiedzi.

Dodaj komentarz

Twój adres e-mail nie zostanie opublikowany. Wymagane pola są oznaczone *