Google Research har offentliggjort betydande uppdateringar inom medicinsk artificiell intelligens genom lanseringen av MedGemma 1.5 och den nya modellen MedASR. Dessa verktyg är utformade för att stödja hälsovården genom avancerad tolkning av medicinska bilder och specialiserad taligenkänning för medicinsk terminologi.
Uppdateringen till MedGemma 1.5 (4B)
Google Research har uppdaterat sin öppna modell MedGemma till version 1.5 (4B). Denna nya version introducerar stöd för högdimensionell medicinsk bildbehandling. Modellen är nu kapabel att hantera och tolka komplexa bildtyper som datortomografi (CT), magnetresonanstomografi (MRI) och histopatologi.
Förbättrad anatomisk lokalisering och dokumentförståelse
Utöver det utökade stödet för bildtyper innebär uppdateringen till version 1.5 förbättringar inom specifika användningsområden. Modellen uppvisar stärkt prestanda gällande anatomisk lokalisering, vilket innebär en förbättrad förmåga att identifiera och placera anatomiska strukturer i medicinska bilder. Dessutom har modellens förmåga att förstå medicinska dokument optimerats.
MedASR: Specialiserad medicinsk tal-till-text
Parallellt med uppdateringen av MedGemma har Google släppt MedASR, en modell för medicinsk tal-till-text. MedASR är specifikt finjusterad för att hantera den unika vokabulär som används inom hälso- och sjukvård. Syftet är att erbjuda en mer exakt konvertering av tal till text inom det medicinska fältet.
Prestanda vid medicinsk diktering
Enligt Google Research överträffar MedASR generella taligenkänningsmodeller när det kommer till medicinsk diktering. Modellen har utvärderats mot benchmarks för medicinsk diktering och har där uppvisat högre precision än modeller som inte är specialiserade på hälsovårdens terminologi.
Programmet Health AI Developer Foundations (HAI-DEF)
Både MedGemma 1.5 och MedASR ingår i programmet Health AI Developer Foundations (HAI-DEF). Detta initiativ syftar till att tillhandahålla grundläggande AI-verktyg specifikt utvecklade för hälsovårdssektorns behov och utmaningar.
Tillgänglighet för forskning och kommersiellt bruk
Google har gjort båda modellerna tillgängliga för en bred användarbas. Modellerna kan nås via plattformarna Hugging Face och Vertex AI. De är öppna för användning inom både forskning och för kommersiella ändamål, vilket möjliggör integration i olika medicinska applikationer och system.

