Kritiken växer mot Anthropics nya AI-modell Fable: ”För restriktiv”

Anthropic har lanserat Fable, en publik version av sin kraftfulla cybersäkerhetsmodell Mythos. Men mottagandet har varit långt ifrån enbart positivt. Säkerhetsforskare varnar nu för att modellens strikta säkerhetsspärrar gör den nästintill oanvändbar för legitima ändamål.

Säkerhetsspärrar som hindrar vardagligt arbete

Fable släpptes tisdagen den 9 juni 2026 som en begränsad och publik version av modellen Mythos, vilken ursprungligen lanserades under ”Project Glasswing” i april samma år. Mythos har sedan juni 2026 expanderat till hundratals organisationer i 15 länder, men Fable representerar den version som nu gjorts tillgänglig för allmänheten.

Trots förväntningarna har lanseringen mötts av betydande kritik från professionella användare inom cybersäkerhet. Valentina ”Chompie” Palmiotti, säkerhetsforskare vid IBM X-Force, rapporterar att Fable avvisar förfrågningar som bara har en avlägsen koppling till cyberämnen. Detta inkluderar till synes harmlösa uppgifter som att be modellen läsa ett blogginlägg.

När en prompt aktiverar dessa spärrar pausas chatten och ett meddelande visas om att säkerhetsåtgärder flaggat innehållet för ämnen relaterade till cybersäkerhet eller biologi. Syftet med restriktionerna är enligt Anthropic att förhindra utveckling av skadlig kod eller biologiska vapen.

Nyckelordsbaserade begränsningar

Enligt Matt Suiche, teknisk expert vid AI-säkerhetsföretaget Tolmo, verkar modellen förlita sig på enkla nyckelordsbaserade triggers. Han noterar exempelvis att en förfrågan om att skriva säker kod kan få AI:n att anta att arbetet rör cybersäkerhet snarare än allmänna bästa praxis för mjukvaruutveckling.

När Fable slår i sina säkerhetsspärrar är den programmerad att automatiskt falla tillbaka på modellen Claude Opus 4.8.

Program för verifierade användare

För att mildra effekterna för legitima yrkesutövare har Anthropic skapat ett ”Cyber Verification Program”. Här kan godkända professionella få tillgång till verktygen med färre begränsningar, ett initiativ som liknar OpenAIs program ”Trusted Access for Cyber”.

Nyckelpunkter om Fable-lanseringen:
  • Lansering: Släpptes för allmänheten den 9 juni 2026.
  • Bakgrund: En begränsad version av Mythos-modellen (Project Glasswing).
  • Kritik: Överdrivet restriktiva spärrar blockerar även harmlösa uppgifter.
  • Teknisk lösning: Vid flaggning växlar modellen till Claude Opus 4.8.
  • Undantag: Godkända forskare kan ansöka om färre restriktioner via ett verifieringsprogram.

Källor

TechCrunch

Känner du någon som skulle uppskatta detta? Tipsa dem genom att dela artikeln!

Relaterade artiklar

Nytt och Aktuellt

Kritiken växer mot Anthropics nya AI-modell Fable: ”För restriktiv”

Känner du någon som skulle uppskatta detta? Tipsa dem genom att dela artikeln!

Relaterade artiklar

Nytt och Aktuellt

Kritiken växer mot Anthropics nya AI-modell Fable: ”För restriktiv”

Känner du någon som skulle uppskatta detta? Tipsa dem genom att dela artikeln!

Related Articles

Latest Articles