Google Gemini Omni: AI-modellen som kan skapa ”vad som helst”

2026-05-20

30

Google lanserar Gemini Omni – ska kunna skapa ”vad som helst”

Under sin årliga utvecklarkonferens I/O har Google avtäckt Gemini Omni, en ny kraftfull AI-modell designad för att generera innehåll från i princip vilken typ av indata som helst. Den första versionen i familjen, kallad Gemini Omni Flash, fokuserar initialt på avancerad videogenerering och redigering.

Google beskriver tekniken som en motsvarighet till deras bildredigerare från 2025 (Nano Banana), men för video. Modellen är för närvarande tillgänglig genom Gemini-appen, Google Flow AI studio och YouTube Shorts.

Från text till video – med verklighetsförankring

Med Gemini Omni Flash kan användare skapa helt nya videoklipp eller redigera befintliga genom att använda enkla textinstruktioner. Enligt Koray Kavukcuoglu, teknikchef på Google DeepMind, kombinerar modellen bilder, ljud, video och text som indata för att skapa högkvalitativa videor.

En av de mest framstående tekniska funktionerna är modellens förmåga att bibehålla konsistens för både karaktärer och miljöer över flera påföljande redigeringar. Dessutom utnyttjar modellen sin inbyggda kunskap om historia, biologi, fysik och berättarlogik för att säkerställa att klippen faktiskt är logiska och verklighetstrogna.

Imponerande användningsområden

Under presentationen visade Google upp flera praktiska exempel på vad tekniken kan göra:

Transformation: En video där en man rör vid en spegel förvandlades till flytande vågor eller 3D-voxelkonst.
Synkronisering: Fönsterlampor i en byggnad synkroniserades för att blinka i takt med ett technospår.
Utbildning: Generering av en förklaring av proteinveckning i claymation-stil (leranimation).

Säkerhet och identifiering

För att hantera risker kring deepfakes och desinformation har modellen genomgått utvärderingar av både interna säkerhetsteam och externa specialister. Som en ytterligare säkerhetsåtgärd inkluderar allt innehåll som skapas eller redigeras med Omni en osynlig digital vattenstämpel kallad SynthID, vilket gör det möjligt att verifiera att materialet är AI-genererat.

Källor

Gizmodo

Föregående artikel

Google utmanar OpenClaw med Gemini Spark – din nya personliga AI-agent

Nästa artikel

Google lanserar Gemini for Science: AI-verktyg som revolutionerar forskning

Google Gemini Omni: AI-modellen som kan skapa ”vad som helst”

Google lanserar Gemini Omni – ska kunna skapa ”vad som helst”

Från text till video – med verklighetsförankring

Imponerande användningsområden

Säkerhet och identifiering

Källor

Relaterade artiklar

Sony lanserar Bravia Theater Trio – ett trådlöst lyxsystem för hemmabio

Slate EV Truck: Förbeställningar öppnar i juni – här är detaljerna

Glöm LASIK: Ny teknik lovar billigare och säkrare synkorrigering utan laser

Nytt och Aktuellt

Sony lanserar Bravia Theater Trio – ett trådlöst lyxsystem för hemmabio

Slate EV Truck: Förbeställningar öppnar i juni – här är detaljerna

Glöm LASIK: Ny teknik lovar billigare och säkrare synkorrigering utan laser

Anthropic lanserar Opus 4.8 – introducerar ”Dynamic Workflows” för massiva kodbaser

Waymo lanserar nästa generations robotaxi: Här är ”Ojai”

Google Gemini Omni: AI-modellen som kan skapa ”vad som helst”

Relaterade artiklar

Sony lanserar Bravia Theater Trio – ett trådlöst lyxsystem för hemmabio

Slate EV Truck: Förbeställningar öppnar i juni – här är detaljerna

Glöm LASIK: Ny teknik lovar billigare och säkrare synkorrigering utan laser

Nytt och Aktuellt

Sony lanserar Bravia Theater Trio – ett trådlöst lyxsystem för hemmabio

Slate EV Truck: Förbeställningar öppnar i juni – här är detaljerna

Glöm LASIK: Ny teknik lovar billigare och säkrare synkorrigering utan laser

Anthropic lanserar Opus 4.8 – introducerar ”Dynamic Workflows” för massiva kodbaser

Waymo lanserar nästa generations robotaxi: Här är ”Ojai”

Google Gemini Omni: AI-modellen som kan skapa ”vad som helst”

Related Articles

Sony lanserar Bravia Theater Trio – ett trådlöst lyxsystem för hemmabio

Slate EV Truck: Förbeställningar öppnar i juni – här är detaljerna

Glöm LASIK: Ny teknik lovar billigare och säkrare synkorrigering utan laser

Latest Articles

Sony lanserar Bravia Theater Trio – ett trådlöst lyxsystem för hemmabio

Slate EV Truck: Förbeställningar öppnar i juni – här är detaljerna

Glöm LASIK: Ny teknik lovar billigare och säkrare synkorrigering utan laser

Anthropic lanserar Opus 4.8 – introducerar ”Dynamic Workflows” för massiva kodbaser

Waymo lanserar nästa generations robotaxi: Här är ”Ojai”