-2.2 C
Stockholm
Tuesday, December 30, 2025

Nari Labs lanserar Dia: En öppen källkodsmodell för röstkloning i realtid

Öppen källkod inom TTS når nya höjder

Teknologin för text-till-tal (TTS) har förbättrats avsevärt under de senaste åren, men de flesta verktyg för högkvalitativ röstgenerering har förblivit stängda och kostsamma. Nu sker en stor förändring inom den öppna AI-världen. Nari Labs har släppt Dia, en kraftfull modell med 1,6 miljarder parametrar som möjliggör röstkloning i realtid och uttrycksfull talsyntes direkt på konsumentenheter.

Vad är Dia från Nari Labs?

Dia är en avancerad text-till-tal-modell med öppen källkod. Med sina 1,6 miljarder parametrar fungerar den som ett omfattande och högt tränat neuralt nätverk som kan förstå både text och röstmönster på en djup nivå. Modellen kan omvandla skriven text till talat ljud som låter naturligt och mänskligt.

Röstkloning i realtid

En central funktion i Dia är dess förmåga att klona en persons röst i realtid. Genom att använda endast ett kort ljudprov kan modellen återskapa rösten utan att det krävs någon ytterligare träning. Detta skiljer modellen från många traditionella system och gör den användbar för snabb personifiering av innehåll.

Lokal körning på konsumenthårdvara

Till skillnad från många proprietära TTS-system är Dia inte beroende av molntjänster. Den är utformad för att kunna köras lokalt på vanlig hårdvara, såsom bärbara och stationära datorer utrustade med moderna processorer (CPU) eller grafikkort (GPU).

Detta innebär flera fördelar för användaren:

  • Lokal kontroll: Användare har full makt över sina egna röstsystem.
  • Inga molnkrav: Processen sker direkt på den egna enheten utan behov av externa API:er.
  • Snabbhet och precision: Modellen är både snabb och träffsäker i sin generering.

En milstolpe för öppen källkod

Lanseringen av Dia visar att modeller med öppen källkod nu kan konkurrera med kommersiella TTS-plattformar. Genom att producera känslomässigt och människolikt tal utan höga kostnader ses Dia som en betydande milstolpe för utvecklare, forskare, nystartade företag och innehållsskapare. Dia lägger en stark grund för framtida innovationer inom röstteknologi där gemenskapen kan bidra till utvecklingen.

Källor

Relaterade artiklar

Nytt och Aktuellt