Det kinesiska AI-bolaget DeepSeek har meddelat en drastisk prissänkning på sina API-tjänster med upp till 90 procent. Genom detta etablerar företaget en ny global lägstanivå för kostnader kopplade till stora språkmodeller. Prissänkningen, som presenterades den 26 april, innebär bland annat att priset för ”input cache hits” över hela produktlinjen har sänkts till en tiondel av det ursprungliga lanseringspriset.
Kraftiga prissänkningar för V4-Pro och V4-Flash
DeepSeeks flaggskeppsmodell, V4-Pro, omfattas nu av en tidsbegränsad rabatt på 75 procent som sträcker sig ända fram till den 5 maj 2026. Detta sänker kostnaden för cachad input till endast 0,025 RMB per miljon tokens (cirka 0,0035 USD).
Prisförändringarna för V4-Pro ser ut enligt följande:
- Icke-cachad input: Sänks från 12 RMB till 3 RMB per miljon tokens.
- Output: Sänks från 24 RMB till 6 RMB per miljon tokens.
Även för den mer snabbfotade modellen DeepSeek-V4-Flash är sänkningen betydande. Priset för cachad input faller där från 0,2 RMB till 0,02 RMB per miljon tokens.
Tekniska genombrott bakom effektiviteten
Dessa prisgenombrott följer lanseringen av de öppna källkodsmodellerna V4-Pro och V4-Flash den 24 april. Modellerna har imponerande specifikationer:
- V4-Pro: 49 miljarder aktiverade parametrar, tränad på 33 biljoner (trillion) tokens.
- V4-Flash: 13 miljarder parametrar, tränad på 32 biljoner tokens.
- Kontextfönster: Båda modellerna stöder upp till 1 miljon tokens.
De låga kostnaderna drivs av en egenutvecklad arkitektur för ”sparse attention”. Denna teknik gör att V4-Pro endast kräver 27 procent av beräkningskraften per token jämfört med föregångaren V3.2, samtidigt som användningen av KV-cache har reducerats till 10 procent.
Prestanda och infrastruktur
Enligt prestandatester står sig V4-Pro starkt inom områden som ”Agentic Coding” och matchar eller överträffar ledande proprietära modeller inom matematik och STEM-ämnen. I lägen utan avancerade resonemang (non-reasoning modes) närmar sig modellen kvalitetsnivån hos Claude Opus 4.6.
Driften av modellerna sker på Huawei Ascend-supernoder. Genom att använda finkornig ”expert parallelism” (EP) har DeepSeek lyckats uppnå hastighetsförbättringar på mellan 1,5x och 1,96x.
Marknadsvärdering och investeringar
DeepSeeks framfart har inte gått obemärkt förbi. Rapporter indikerar att de kinesiska teknikjättarna Tencent och Alibaba för närvarande för diskussioner om att investera i bolaget. Värderingen av DeepSeek uppges i dessa samtal överstiga 20 miljarder USD.

