-2.1 C
Stockholm
Tuesday, December 30, 2025

Ai2 lanserar Molmo 2: Öppen multimodal AI som presterar med mindre data

Allen Institute for AI (Ai2) har presenterat Molmo 2, en ny serie av öppna multimodala modeller. Denna nya generation expanderar den ursprungliga Molmo-modellens bildförståelse till att nu även inkludera video och förmågan att resonera kring flera bilder samtidigt.

Mer effektiv träning med mindre data

En central aspekt av Molmo 2 är dess förmåga att nå hög prestanda med betydligt mindre träningsdata än sina proprietära konkurrenter. Enligt Ai2 har modellen tränats på 9,19 miljoner videor. Detta kan jämföras med Metas PerceptionLM, som kräver 72,5 miljoner videor för sin träning.

Trots den mindre datamängden visar Molmo 2 imponerande resultat i jämförelser. Modellen uppges prestera bättre än system som Gemini 3 Pro när det kommer till videospårning och så kallad “grounding”.

Tre varianter för olika behov

Modellfamiljen Molmo 2 består av tre specifika varianter:

  • 8B-version: Baserad på Qwen 3.
  • 4B-version: Baserad på Qwen 3.
  • Molmo 2-O (7B): En modell byggd på Olmo-ramverket. Denna variant är framtagen för att erbjuda ett helt öppet och sammanhängande flöde (end-to-end model flow).

Genom lanseringen av Molmo 2 fortsätter Ai2 att utmana stora proprietära modeller genom att demonstrera hur öppna system kan uppnå tekniska genombrott inom video- och bildförståelse med mer effektiva metoder.

Källor

Relaterade artiklar

Nytt och Aktuellt