Google Veo 3.1: Från porträttbilder till vertikal AI-video i 4K

2026-01-14

95

Google Veo 3.1: Revolutionerande kontroll genom referensbilder och 4K-stöd för vertikal video

Google har presenterat en omfattande uppdatering av sin AI-videomodell i form av Veo 3.1. Denna nya iteration innebär ett betydande skifte i hur AI-genererad video skapas, med ett utpräglat fokus på referensbaserat innehåll och format anpassade för den mobila tidsåldern. Genom att introducera nya verktyg för kontroll och tekniska förbättringar i bildupplösning, positionerar Google Veo som ett kraftfullt verktyg för både konsumenter och professionella kreatörer.

Ingredients to Video: Precision genom referensbilder

Kärnan i Veo 3.1-uppdateringen är det nya verktyget “Ingredients to Video”. Denna funktion är utformad för att ge användaren avsevärt mer kontroll över det slutgiltiga resultatet jämfört med tidigare versioner.

Genom verktyget kan användare ladda upp upp till tre referensbilder. Dessa bilder fungerar som instruktioner för AI-modellen att diktera specifika element i videon:

Karaktärer: Säkerställer att specifika personer eller figurer återskapas korrekt.
Bakgrunder: Definierar den miljö där handlingen utspelar sig.
Texturer: Ger detaljerad kontroll över ytfinish och visuella egenskaper.

Native stöd för vertikala format

Som svar på den växande populariteten för mobilanpassat innehåll introducerar Veo 3.1 inbyggt stöd för vertikal videogenerering (9:16). Detta format är specifikt framtaget för att passa plattformar som TikTok och YouTube Shorts. Genom att generera videon direkt i detta format elimineras behovet av manuell beskärning i efterhand, vilket bevarar kompositionen och bildkvaliteten för högkantsskärmar.

Tekniska förbättringar och identitetsstabilitet

Google har implementerat flera djupgående tekniska förbättringar för att höja kvaliteten på de genererade klippen:

Identitetsstabilitet (Identity consistency): En av de största utmaningarna i AI-video har varit att bibehålla konsekvens. Veo 3.1 har förbättrad förmåga att se till att karaktärer och objekt förblir enhetliga och oförändrade över olika scener.
Rörelse och uttryck: Modellen har blivit bättre på att hantera rörelsemönster och ansiktsuttryck, även när användaren tillhandahåller kortare textinstruktioner (prompts).
Sömlös sammanfogning: Uppdateringen inkluderar förbättrad “stitching”, vilket innebär att disparata element kan fogas samman på ett mer naturligt och tekniskt felfritt sätt.

Från 1080p till 4K-upplösning

Veo 3.1 innebär ett stort kliv framåt när det gäller visuell skärpa. Grundnivån för modellen är 1080p, vilken i sig har förfinats för att erbjuda ökad klarhet. Som en stor nyhet introduceras nu även en uppskalningsfunktion som kan höja videoupplösningen ända upp till 4K, vilket möter kraven för professionell videoproduktion.

Integration i Googles ekosystem

Veo 3.1 rullas ut brett över Googles olika tjänster för att nå olika användargrupper:

Konsumenter: Funktionerna integreras direkt i Gemini-appen, YouTube Shorts och appen YouTube Create.
Professionella användare: För utvecklare och företag görs Veo 3.1 tillgänglig via Gemini API, Vertex AI och Google Vids.

Säkerhet och transparens i skapandet

För att hantera de etiska och säkerhetsmässiga aspekterna av AI-genererat material har Google implementerat dubbla skyddslager för transparens:

SynthID: Osynliga vattenstämplar bäddas in i videofilerna för att möjliggöra identifiering av AI-ursprung.
AI-etiketter: Synliga märkningar placeras på innehållet för att tydligt kommunicera till tittaren att videon är skapad med hjälp av artificiell intelligens.

Källor

The Verge

Föregående artikel

AstraZeneca förvärvar Modella AI för att påskynda onkologiforskning

Nästa artikel

ChatGPT Translate utmanar Google Translate: En ny era för AI-översättning har börjat

Google Veo 3.1: Från porträttbilder till vertikal AI-video i 4K

Google Veo 3.1: Revolutionerande kontroll genom referensbilder och 4K-stöd för vertikal video

Ingredients to Video: Precision genom referensbilder

Native stöd för vertikala format

Tekniska förbättringar och identitetsstabilitet

Från 1080p till 4K-upplösning

Integration i Googles ekosystem

Säkerhet och transparens i skapandet

Källor

Relaterade artiklar

Google lanserar Gemma 4 under Apache 2.0: Fyra nya modeller med inbyggd multimodalitet

ElevenLabs lanserar ElevenMusic: AI-driven musikgenerering från text

Meta lanserar nya smarta glasögon för receptbelagda linser: Blayzer och Scriber Optics

Nytt och Aktuellt

Google lanserar Gemma 4 under Apache 2.0: Fyra nya modeller med inbyggd multimodalitet

ElevenLabs lanserar ElevenMusic: AI-driven musikgenerering från text

Meta lanserar nya smarta glasögon för receptbelagda linser: Blayzer och Scriber Optics

Google lanserar Gemini-driven realtidsöversättning för iOS – fungerar med alla hörlurar

Kinas genombrott för medicinska alfa-isotoper: Massproduktion vid CSNS