Google lanserar Gemini Omni – ska kunna skapa ”vad som helst”
Under sin årliga utvecklarkonferens I/O har Google avtäckt Gemini Omni, en ny kraftfull AI-modell designad för att generera innehåll från i princip vilken typ av indata som helst. Den första versionen i familjen, kallad Gemini Omni Flash, fokuserar initialt på avancerad videogenerering och redigering.
Google beskriver tekniken som en motsvarighet till deras bildredigerare från 2025 (Nano Banana), men för video. Modellen är för närvarande tillgänglig genom Gemini-appen, Google Flow AI studio och YouTube Shorts.
Från text till video – med verklighetsförankring
Med Gemini Omni Flash kan användare skapa helt nya videoklipp eller redigera befintliga genom att använda enkla textinstruktioner. Enligt Koray Kavukcuoglu, teknikchef på Google DeepMind, kombinerar modellen bilder, ljud, video och text som indata för att skapa högkvalitativa videor.
En av de mest framstående tekniska funktionerna är modellens förmåga att bibehålla konsistens för både karaktärer och miljöer över flera påföljande redigeringar. Dessutom utnyttjar modellen sin inbyggda kunskap om historia, biologi, fysik och berättarlogik för att säkerställa att klippen faktiskt är logiska och verklighetstrogna.
Imponerande användningsområden
Under presentationen visade Google upp flera praktiska exempel på vad tekniken kan göra:
- Transformation: En video där en man rör vid en spegel förvandlades till flytande vågor eller 3D-voxelkonst.
- Synkronisering: Fönsterlampor i en byggnad synkroniserades för att blinka i takt med ett technospår.
- Utbildning: Generering av en förklaring av proteinveckning i claymation-stil (leranimation).
Säkerhet och identifiering
För att hantera risker kring deepfakes och desinformation har modellen genomgått utvärderingar av både interna säkerhetsteam och externa specialister. Som en ytterligare säkerhetsåtgärd inkluderar allt innehåll som skapas eller redigeras med Omni en osynlig digital vattenstämpel kallad SynthID, vilket gör det möjligt att verifiera att materialet är AI-genererat.

