Google har genomfört en teknisk lansering av Lyria 3, en generativ musikmodell som nu integreras direkt i Gemini-appen. Lanseringen introducerar nya möjligheter för användare att skapa musikspår baserade på text- eller bildbaserade uppmaningar, med stöd för multimodal funktionalitet och vattenmärkning.
Den nya modellen, Lyria 3, är utformad för att generera 30 sekunder långa musikspår. Dessa genererade filer inkluderar inte bara instrumentala komponenter utan även sångtexter och vokala framträdanden. Enligt de tekniska specifikationerna erbjuder denna iteration ljud av hög kvalitet (high-fidelity) samt en förbättrad vokal prestanda jämfört med tidigare versioner av tekniken.
Multimodal integration och visuella verktyg
En central del av lanseringen är den multimodala integrationen som sammankopplar ljudgenereringen med visuella komponenter. Systemet använder tekniken Nano Banana för automatiserad generering av omslagsbilder till musiken. För att ytterligare förstärka den visuella upplevelsen har en integration med Veo 3.1 implementerats, vilket syftar till att skapa en visuell synergi med det genererade ljudet.
Tillgänglighet och marknadsposition
Lyria 3 distribueras för närvarande i en beta-version inuti Gemini-appen. Vid lanseringen har systemet stöd för åtta olika språk. Målsättningen med denna utrullning är att konkurrera med existerande generativa plattformar på marknaden. Detta görs genom att tillhandahålla interaktiva verktyg för musikskapande kostnadsfritt direkt till användare av Gemini.
Säkerhet och identifiering
För att säkerställa transparens och spårbarhet av det AI-genererade materialet har Google implementerat SynthID. Detta är en teknik för vattenmärkning som används för identifiering av AI-innehåll, vilket integreras som en del av de tekniska specifikationerna för Lyria 3.

