DeepSeek lanserar V4: En multimodal MoE-modell med en biljon parametrar

2026-03-09

101

I mars 2026 tog utvecklingen av artificiell intelligens en ny riktning när DeepSeek lanserade sin senaste modell, V4. Denna lansering introducerar en massiv arkitektur som är designad för att hantera enorma mängder data och komplexa uppgifter, samtidigt som den markerar ett strategiskt skifte i vilken hårdvara som driver tekniken framåt.

En biljon parametrar och Mixture-of-Experts

DeepSeek V4 bygger på en så kallad Mixture-of-Experts (MoE)-arkitektur. Modellen rymmer totalt en biljon parametrar. Trots denna enorma totala storlek är arkitekturen utformad så att endast cirka 32 miljarder parametrar är aktiva per genererad token. Denna struktur möjliggör en effektiv hantering av beräkningskraften vid varje given operation, trots modellens massiva omfång.

Inbyggd multimodalitet från grunden

Till skillnad från tidigare versioner är V4 tränad inbyggt på flera olika datatyper samtidigt. Modellen bearbetar text, bild, video och ljud parallellt. Denna simultana träning skapar en inbyggd multimodalitet där de olika formaten integreras direkt i modellens grundstruktur under träningsfasen.

Hårdvaruoberoende och optimering för kinesiska chip

En central teknisk specifikation för DeepSeek V4 är dess djupa optimering för kisel tillverkat i Kina. Modellen är specifikt anpassad för chip som Huawei Ascend och Cambricon. Syftet med denna inriktning är att säkerställa ett hårdvaruoberoende från västerländska grafikkort (GPU:er), vilket gör det möjligt att driva den avancerade modellen fullt ut på inhemsk kinesisk hårdvara.

Företagsapplikationer och ett massivt kontextfönster

Modellen har släppts under en licens för öppen källkod och riktar sig primärt mot användningsområden inom företagssektorn. Specifika målapplikationer inkluderar storskalig mjukvaruutveckling och analys av juridiska dokument. För att hantera dessa krävande uppgifter är V4 utrustad med ett kontextfönster som överstiger en miljon tokens. Enligt rapporterna överträffar modellen sina konkurrenter i prestandatester (benchmarks) som specifikt mäter förmågan att hantera långa kontexter.

Sammanfattningsvis representerar lanseringen av DeepSeek V4 en betydande teknisk milstolpe. Genom att kombinera en biljon parametrar i en MoE-arkitektur, inbyggd multimodalitet för text, bild, video och ljud, samt ett kontextfönster på över en miljon tokens, skapas ett kraftfullt verktyg för företagssektorn. Samtidigt etablerar den djupa optimeringen för Huawei Ascend och Cambricon en ny nivå av oberoende från västerländsk hårdvara, allt tillgängligt via öppen källkod.

Källor

QverLabs

Föregående artikel

Microsoft lanserar Phi-4-Reasoning-Vision-15B: En multimodal modell för visuellt resonemang

Nästa artikel

Ny molekylär bro förhindrar leukemiceller från att undkomma CAR T-cellsterapi

DeepSeek lanserar V4: En multimodal MoE-modell med en biljon parametrar

En biljon parametrar och Mixture-of-Experts

Inbyggd multimodalitet från grunden

Hårdvaruoberoende och optimering för kinesiska chip

Företagsapplikationer och ett massivt kontextfönster

Källor

Relaterade artiklar

Sony lanserar Bravia Theater Trio – ett trådlöst lyxsystem för hemmabio

Slate EV Truck: Förbeställningar öppnar i juni – här är detaljerna

Glöm LASIK: Ny teknik lovar billigare och säkrare synkorrigering utan laser

Nytt och Aktuellt

Sony lanserar Bravia Theater Trio – ett trådlöst lyxsystem för hemmabio

Slate EV Truck: Förbeställningar öppnar i juni – här är detaljerna

Glöm LASIK: Ny teknik lovar billigare och säkrare synkorrigering utan laser

Anthropic lanserar Opus 4.8 – introducerar ”Dynamic Workflows” för massiva kodbaser

Waymo lanserar nästa generations robotaxi: Här är ”Ojai”

DeepSeek lanserar V4: En multimodal MoE-modell med en biljon parametrar

Relaterade artiklar

Sony lanserar Bravia Theater Trio – ett trådlöst lyxsystem för hemmabio

Slate EV Truck: Förbeställningar öppnar i juni – här är detaljerna

Glöm LASIK: Ny teknik lovar billigare och säkrare synkorrigering utan laser

Nytt och Aktuellt

Sony lanserar Bravia Theater Trio – ett trådlöst lyxsystem för hemmabio

Slate EV Truck: Förbeställningar öppnar i juni – här är detaljerna

Glöm LASIK: Ny teknik lovar billigare och säkrare synkorrigering utan laser

Anthropic lanserar Opus 4.8 – introducerar ”Dynamic Workflows” för massiva kodbaser

Waymo lanserar nästa generations robotaxi: Här är ”Ojai”

DeepSeek lanserar V4: En multimodal MoE-modell med en biljon parametrar

Related Articles

Sony lanserar Bravia Theater Trio – ett trådlöst lyxsystem för hemmabio

Slate EV Truck: Förbeställningar öppnar i juni – här är detaljerna

Glöm LASIK: Ny teknik lovar billigare och säkrare synkorrigering utan laser

Latest Articles

Sony lanserar Bravia Theater Trio – ett trådlöst lyxsystem för hemmabio

Slate EV Truck: Förbeställningar öppnar i juni – här är detaljerna

Glöm LASIK: Ny teknik lovar billigare och säkrare synkorrigering utan laser

Anthropic lanserar Opus 4.8 – introducerar ”Dynamic Workflows” för massiva kodbaser

Waymo lanserar nästa generations robotaxi: Här är ”Ojai”