Wat is Gemini 1.5? Wat je moet weten
In een blogpost die donderdag werd gedeeld, kondigde Google de release aan van Gemini 1.5, het AI-model van de volgende generatie dat aanzienlijke verbeteringen op het gebied van prestaties en efficiëntie belooft. Een van de verbeteringen is de mogelijkheid om enorme hoeveelheden informatie te verwerken en te begrijpen, tot wel 1 miljoen tokens tegelijk.
Wat is Gemini 1.5?
Voortbouwend op het succes van Gemini 1.0 maakt de nieuwste versie gebruik van een nieuwe Mixture-of-Experts (MoE)-architectuur die het AI-model in kleinere gespecialiseerde netwerken verdeelt. Google zegt dat dit een efficiëntere verwerking en training mogelijk maakt, terwijl de hoge prestaties behouden blijven. Hierdoor zal Gemini 1.5 multimodale invoer, inclusief tekst, afbeeldingen, audio en video, met betere nauwkeurigheid en begrip kunnen verwerken.
Een van de opvallende kenmerken van het nieuwe model is het uitgebreide contextvenster. Terwijl het vorige model slechts 32.000 tokens kon verwerken, kan Gemini 1.5 tot 1 miljoen tokens verwerken. Hierdoor kan het een grotere hoeveelheid tekst, code, video en audio verwerken, analyseren en erover redeneren, zelfs als deze in één prompt worden toegevoegd.
Het uitgebreide contextvenster ontgrendelt nieuwe functionaliteiten:
- Multimodaal begrip : het model kan verschillende mediatypen verwerken, zoals het analyseren van de plot van een stomme film op basis van uitsluitend beeldmateriaal.
- Relevante probleemoplossing : Wanneer Gemini 1.5 met grote codebases wordt gepresenteerd, kan het wijzigingen voorstellen en uitleggen hoe verschillende onderdelen op elkaar inwerken.
Google heeft ook onthuld dat Gemini 1.5 beter presteert dan Gemini 1.0 Pro op 87% van de taken en overeenkomt met de prestaties van Gemini 1.0 Ultra, zelfs met zijn grotere contextvenster.
Toegang en beschikbaarheid
Google biedt ontwikkelaars en zakelijke klanten een beperkte preview van Gemini 1.5 Pro aan met een contextvenster van 128.000 tokens. De in aanmerking komende gebruikers kunnen het tokenvenster van 1 miljoen ook kosteloos testen, maar met een langere latentie. Het bedrijf is ook van plan om in de toekomst prijsniveaus te introduceren op basis van de contextvenstergrootte.
Gemini 1.5 Pro-demo van Google
Hier is een video die Google op YouTube heeft gedeeld en waarin het vermogen om lange contexten te begrijpen wordt gedemonstreerd via een live interactie met behulp van een pdf-transcript van 402 pagina’s en multimodale aanwijzingen. De demonstratie omvat een continue registratie van de reacties van het model, waarbij de responstijden worden aangegeven. Het totale aantal tokens voor de invoer-PDF (326.658 tokens) en afbeelding (256 tokens) is 326.914, terwijl de tekstinvoer het totaal verhoogt tot 327.309 tokens.
Geef een reactie