-11.1 C
Stockholm
Thursday, February 19, 2026

MedGemma 1.5 och MedASR: Google Research lanserar nästa generations AI för medicinsk bildtolkning och tal-till-text

Google Research har offentliggjort betydande uppdateringar inom medicinsk artificiell intelligens genom lanseringen av MedGemma 1.5 och den nya modellen MedASR. Dessa verktyg är utformade för att stödja hälsovården genom avancerad tolkning av medicinska bilder och specialiserad taligenkänning för medicinsk terminologi.

Uppdateringen till MedGemma 1.5 (4B)

Google Research har uppdaterat sin öppna modell MedGemma till version 1.5 (4B). Denna nya version introducerar stöd för högdimensionell medicinsk bildbehandling. Modellen är nu kapabel att hantera och tolka komplexa bildtyper som datortomografi (CT), magnetresonanstomografi (MRI) och histopatologi.

Förbättrad anatomisk lokalisering och dokumentförståelse

Utöver det utökade stödet för bildtyper innebär uppdateringen till version 1.5 förbättringar inom specifika användningsområden. Modellen uppvisar stärkt prestanda gällande anatomisk lokalisering, vilket innebär en förbättrad förmåga att identifiera och placera anatomiska strukturer i medicinska bilder. Dessutom har modellens förmåga att förstå medicinska dokument optimerats.

MedASR: Specialiserad medicinsk tal-till-text

Parallellt med uppdateringen av MedGemma har Google släppt MedASR, en modell för medicinsk tal-till-text. MedASR är specifikt finjusterad för att hantera den unika vokabulär som används inom hälso- och sjukvård. Syftet är att erbjuda en mer exakt konvertering av tal till text inom det medicinska fältet.

Prestanda vid medicinsk diktering

Enligt Google Research överträffar MedASR generella taligenkänningsmodeller när det kommer till medicinsk diktering. Modellen har utvärderats mot benchmarks för medicinsk diktering och har där uppvisat högre precision än modeller som inte är specialiserade på hälsovårdens terminologi.

Programmet Health AI Developer Foundations (HAI-DEF)

Både MedGemma 1.5 och MedASR ingår i programmet Health AI Developer Foundations (HAI-DEF). Detta initiativ syftar till att tillhandahålla grundläggande AI-verktyg specifikt utvecklade för hälsovårdssektorns behov och utmaningar.

Tillgänglighet för forskning och kommersiellt bruk

Google har gjort båda modellerna tillgängliga för en bred användarbas. Modellerna kan nås via plattformarna Hugging Face och Vertex AI. De är öppna för användning inom både forskning och för kommersiella ändamål, vilket möjliggör integration i olika medicinska applikationer och system.

Källor

Känner du någon som skulle uppskatta detta? Tipsa dem genom att dela artikeln!

Relaterade artiklar

Nytt och Aktuellt