Google Veo 3.1: Revolutionerande kontroll genom referensbilder och 4K-stöd för vertikal video
Google har presenterat en omfattande uppdatering av sin AI-videomodell i form av Veo 3.1. Denna nya iteration innebär ett betydande skifte i hur AI-genererad video skapas, med ett utpräglat fokus på referensbaserat innehåll och format anpassade för den mobila tidsåldern. Genom att introducera nya verktyg för kontroll och tekniska förbättringar i bildupplösning, positionerar Google Veo som ett kraftfullt verktyg för både konsumenter och professionella kreatörer.
Ingredients to Video: Precision genom referensbilder
Kärnan i Veo 3.1-uppdateringen är det nya verktyget “Ingredients to Video”. Denna funktion är utformad för att ge användaren avsevärt mer kontroll över det slutgiltiga resultatet jämfört med tidigare versioner.
Genom verktyget kan användare ladda upp upp till tre referensbilder. Dessa bilder fungerar som instruktioner för AI-modellen att diktera specifika element i videon:
- Karaktärer: Säkerställer att specifika personer eller figurer återskapas korrekt.
- Bakgrunder: Definierar den miljö där handlingen utspelar sig.
- Texturer: Ger detaljerad kontroll över ytfinish och visuella egenskaper.
Native stöd för vertikala format
Som svar på den växande populariteten för mobilanpassat innehåll introducerar Veo 3.1 inbyggt stöd för vertikal videogenerering (9:16). Detta format är specifikt framtaget för att passa plattformar som TikTok och YouTube Shorts. Genom att generera videon direkt i detta format elimineras behovet av manuell beskärning i efterhand, vilket bevarar kompositionen och bildkvaliteten för högkantsskärmar.
Tekniska förbättringar och identitetsstabilitet
Google har implementerat flera djupgående tekniska förbättringar för att höja kvaliteten på de genererade klippen:
- Identitetsstabilitet (Identity consistency): En av de största utmaningarna i AI-video har varit att bibehålla konsekvens. Veo 3.1 har förbättrad förmåga att se till att karaktärer och objekt förblir enhetliga och oförändrade över olika scener.
- Rörelse och uttryck: Modellen har blivit bättre på att hantera rörelsemönster och ansiktsuttryck, även när användaren tillhandahåller kortare textinstruktioner (prompts).
- Sömlös sammanfogning: Uppdateringen inkluderar förbättrad “stitching”, vilket innebär att disparata element kan fogas samman på ett mer naturligt och tekniskt felfritt sätt.
Från 1080p till 4K-upplösning
Veo 3.1 innebär ett stort kliv framåt när det gäller visuell skärpa. Grundnivån för modellen är 1080p, vilken i sig har förfinats för att erbjuda ökad klarhet. Som en stor nyhet introduceras nu även en uppskalningsfunktion som kan höja videoupplösningen ända upp till 4K, vilket möter kraven för professionell videoproduktion.
Integration i Googles ekosystem
Veo 3.1 rullas ut brett över Googles olika tjänster för att nå olika användargrupper:
- Konsumenter: Funktionerna integreras direkt i Gemini-appen, YouTube Shorts och appen YouTube Create.
- Professionella användare: För utvecklare och företag görs Veo 3.1 tillgänglig via Gemini API, Vertex AI och Google Vids.
Säkerhet och transparens i skapandet
För att hantera de etiska och säkerhetsmässiga aspekterna av AI-genererat material har Google implementerat dubbla skyddslager för transparens:
- SynthID: Osynliga vattenstämplar bäddas in i videofilerna för att möjliggöra identifiering av AI-ursprung.
- AI-etiketter: Synliga märkningar placeras på innehållet för att tydligt kommunicera till tittaren att videon är skapad med hjälp av artificiell intelligens.

