Forskare vid Google DeepMind har tagit ett betydande steg mot att avmystifiera hur artificiell intelligens faktiskt fattar beslut. Genom lanseringen av Gemma Scope 2 introduceras nu en komplett svit för ”full-stack”-tolkbarhet, skräddarsydd för de nyligen släppta Gemma 3-modellerna.
En av de största utmaningarna inom modern AI-utveckling är det som ofta kallas för ”den svarta lådan” – det faktum att även om vi kan träna modeller att utföra komplexa uppgifter, är det svårt att exakt förstå varför en modell ger ett visst svar. Google DeepMind, med sitt ursprung i London och numera en central del av Googles globala AI-satsning, arbetar aktivt för att lösa detta genom forskningsfältet mekanistisk tolkbarhet.
Vad är Gemma Scope 2?
Gemma Scope 2 är en omfattande samling av så kallade Sparse Autoencoders (SAE). Detta är en sorts hjälpmodeller som tränas för att identifiera och isolera specifika ”features” eller koncept inuti de neurala nätverken i Gemma 3.
Istället för att se en ogenomtränglig massa av matematiska vikter, tillåter Gemma Scope 2 forskare att se exakt vilka delar av modellen som aktiveras när den bearbetar specifika ämnen – allt från programmeringslogik till språkliga nyanser.
Varför det är viktigt för framtidens AI
Lanseringen ses som en milstolpe av flera anledningar:
- Säkerhet och kontroll: Genom att förstå hur en modell ”tänker” kan utvecklare lättare identifiera och korrigera oönskade beteenden eller fördomar innan de orsakar problem.
- Effektivitet: Insikterna från Gemma Scope 2 kan användas för att göra framtida modeller mer effektiva genom att rensa bort onödiga beräkningssteg.
- Öppen forskning: Genom att göra dessa verktyg tillgängliga för det breda forskarsamhället accelererar Google DeepMind takten i hur snabbt vi kan nå en djupare förståelse för artificiell intelligens.
En komplett lösning för Gemma 3
Det som gör version 2 särskilt potent är dess integration med Gemma 3-familjen. Gemma 3 är Googles senaste öppna modellserie som stöder multimodalitet (text och bild i kombination). Att kunna tolka hur en modell översätter visuella intryck till textuella resonemang är ett tekniskt genombrott som tidigare varit begränsat till mycket små eller proprietära modeller.
Med Gemma Scope 2 befäster Google DeepMind sin position som ledande inom ansvarsfull AI-utveckling. Verktygen finns nu tillgängliga för forskare och utvecklare världen över via plattformar som Hugging Face och Google Cloud.

