Meta tar bildigenkänning till en ny nivå
Meta AI har officiellt lanserat den tredje generationen av sin banbrytande AI, Segment Anything Model (SAM 3). Denna nya version är inte bara en uppdatering, utan ett stort kliv framåt för hur AI kan tolka och interagera med visuellt innehåll. SAM 3 kan nu identifiera, segmentera och spåra objekt i både bilder och videor med hjälp av enkla textbeskrivningar.
Från klick till koncept
Tidigare versioner av SAM krävde att användaren manuellt markerade objekt med klick eller rutor. SAM 3 introducerar vad Meta kallar “Promptable Concept Segmentation”, vilket innebär att du kan skriva en kort fras, som “gul skolbuss” eller “randig katt”, och AI:n kommer automatiskt att hitta och markera alla förekomster av det konceptet i en bild eller genom en hel video. Detta var en av de mest efterfrågade funktionerna från utvecklargemenskapen.
En enhetlig och kraftfull modell
SAM 3 är en enhetlig modell som kombinerar flera funktioner under ett och samma tak. Den hanterar allt från segmentering i enskilda bilder och video till interaktiv finslipning och konceptdriven igenkänning. Denna mångsidighet gör den till ett kraftfullt verktyg för allt från datamärkning till kreativa videoeffekter och avancerad multimodal AI-resonemang.
Hur fungerar det?
Modellen använder en avancerad arkitektur som separerar den visuella tolkningen från användarens instruktioner (prompter). Det innebär att samma kärnmodell kan användas för en mängd olika segmenteringsuppgifter. Förutom text kan SAM 3 även ta emot visuella prompter som punkter, rutor, masker och till och med bildexempel för att precisera sökningen.
Praktiska tillämpningar och framtiden
Meta integrerar redan SAM 3 i sina egna produkter. Snart kommer nya videoeffekter till Instagrams redigeringsapp “Edits”, där kreatörer kan applicera effekter på specifika personer eller objekt i sina videor. Funktionen kommer även att dyka upp i Meta AI-appen. Dessutom används tekniken i Facebook Marketplace för en “View in Room”-funktion, som låter användare visualisera möbler i sitt eget hem.
För att göra tekniken mer tillgänglig har Meta också lanserat “Segment Anything Playground”, en onlineplattform där vem som helst kan experimentera med modellens kapacitet utan teknisk expertis. Med lanseringen av SAM 3, som är open source, fortsätter Meta att driva utvecklingen framåt och öppnar upp för en ny era av kreativitet och interaktion med visuellt innehåll.

