Google lanceert zijn krachtigste AI-model, Gemini

Woensdag lanceerde Google een nieuw multimodaal algemeen AI-model (kunstmatige intelligentie), Gemini, om te concurreren met producten van OpenAI, Microsoft en Meta.

Google lanceert zijn krachtigste AI-model, Gemini

Google lanceert Gemini

Volgens de zoekgigant is Gemini het ‘grootste en meest capabele’ grote taalmodel (LLM) dat het bedrijf ooit heeft gebouwd, met state-of-the-art prestaties in veel toonaangevende benchmarks.

Dit flexibele AI-model is ontwikkeld door de Google DeepMind AI-eenheid en is getraind op de Tensor Processing Units (TPU) van Google, waardoor het aanzienlijk sneller werkt dan eerdere, kleinere en minder capabele modellen. Het kan verschillende soorten informatie generaliseren en naadloos begrijpen, gebruiken en combineren, waaronder tekst, code, audio, afbeeldingen en video.

Google brengt Gemini 1.0, de eerste versie, in drie verschillende formaten: Gemini Ultra, het grootste en meest capabele model voor zeer complexe taken; Gemini Pro, het beste model voor schaalvergroting voor een breed scala aan taken; en Gemini Nano, het meest efficiënte model voor taken op het apparaat.

“Dit zijn de eerste modellen van het Gemini-tijdperk en de eerste realisatie van de visie die we hadden toen we eerder dit jaar Google DeepMind oprichtten. Dit nieuwe tijdperk van modellen vertegenwoordigt een van de grootste wetenschappelijke en technische inspanningen die we als bedrijf hebben ondernomen”, zegt Sundar Pichai, CEO van Google en Alphabet, in een notitie bij de blogpost over de aankondiging.

Volgens Google DeepMind presteert Gemini Ultra beter dan GPT-4 op 30 van de 32 veelgebruikte academische benchmarktests die capaciteiten meten zoals beeldbegrip of wiskundig redeneren.

Google zegt in het bijzonder de score van Gemini Ultra van 90 procent op de MMLU (massive multitask Language Understanding), die een combinatie van 57 onderwerpen gebruikt, zoals wiskunde, natuurkunde, geschiedenis, recht, geneeskunde en ethiek voor het testen van zowel wereldkennis als probleemstelling. oplossend vermogen, maakt het het eerste AI-model dat menselijke experts op dat vlak overtreft.

Bovendien zei Google dat Gemini Ultra 59,4% scoorde op de nieuwe MMMU-benchmark, bestaande uit multimodale taken die verschillende domeinen bestrijken en die opzettelijk redeneren vereisen. Het presteerde zelfs beter dan eerdere modellen in beeldbenchmarks zonder hulp van optische tekenherkenningssystemen (OCR), die tekst uit afbeeldingen extraheren voor verdere verwerking.

Beschikbaarheid van Gemini AI

Google zegt dat de Pro-versie nu beschikbaar is in de Bard-chatbot en in het Engels beschikbaar zal zijn in meer dan 170 landen en gebieden, met plannen om binnenkort uit te breiden naar verschillende modaliteiten en nieuwe talen en locaties te ondersteunen. Vanaf 13 december hebben ontwikkelaars en zakelijke klanten toegang tot Gemini Pro via de Gemini API in Google AI Studio of Google Cloud Vertex AI.

Verder brengt Google Gemini Nano ook uit op Pixel 8 Pro-smartphones en heeft het plannen om Gemini in de komende maanden te integreren in zijn zoek-, advertentie-, Chrome- en andere services. Bovendien hebben Android-ontwikkelaars toegang tot Gemini Nano via AICore, een nieuwe systeemmogelijkheid die beschikbaar is in Android 14, te beginnen op Pixel 8 Pro-apparaten, die beschikbaar zal zijn op een vroege preview-basis.

Ten slotte is Google van plan om begin 2024 de meest geavanceerde versie van het AI-model, Gemini Ultra, via Bard Advanced uit te brengen. Het zal beschikbaar zijn voor geselecteerde klanten, ontwikkelaars, partners en veiligheids- en verantwoordelijkheidsexperts “voor vroege experimenten en feedback” voordat het begin volgend jaar wordt uitgerold naar ontwikkelaars en zakelijke klanten.

Nieuwste artikelen

Gerelateerde artikelen