Forskare vid Ecole Polytechnique Fédérale de Lausanne (EPFL) har tagit ett stort steg framåt inom kemisk forskning. Genom att utveckla det nya AI-ramverket Synthegy kan kemister nu designa komplexa molekyler genom att helt enkelt beskriva dem med naturligt språk.
Projektet, som leds av Philippe Schwaller, använder stora språkmodeller (LLM) som resonemangsverktyg för att förenkla den annars mycket svåra processen med molekylär design. Traditionellt kräver skapandet av nya molekyler för läkemedel eller material en komplex metod som kallas retrosyntes. Det innebär att man arbetar baklänges från en slutlig förening för att identifiera nödvändiga startmaterial och reaktionsvägar, samtidigt som man måste förstå komplicerade reaktionsmekanismer som involverar elektronrörelser.
Synthegy: En intelligent guide för kemisk syntes
Synthegy övervinner begränsningarna i traditionella beräkningsverktyg genom att låta kemister vägleda planeringsprocessen med vanligt tal eller text. Systemet fungerar genom att omvandla potentiella reaktionsvägar – som genererats av standardprogramvara – till text. En språkmodell utvärderar sedan och poängsätter dessa vägar baserat på kemistens specifika instruktioner.
Exempel på instruktioner kan vara att:
- Bilda en specifik ringstruktur tidigt i processen.
- Undvika onödiga skyddsgrupper.
- Prioritera mer effektiva strategier.
Samma metodik används för att analysera reaktionsmekanismer. AI-systemet styr sökandet mot de vägar som är mest kemiskt logiska genom att analysera hur elektroner rör sig under reaktionen.
Presterar i nivå med mänskliga experter
För att testa systemets tillförlitlighet genomfördes en dubbelblind studie där 36 kemister utförde totalt 368 utvärderingar. Resultaten visade att Synthegys bedömningar i genomsnitt överensstämde med de mänskliga experternas utvärderingar i 71,2 % av fallen.
Studien visade även att storleken på språkmodellen spelar roll; större modeller var signifikant bättre på att flagga genomförbara reaktioner och prioritera effektiva syntesvägar jämfört med mindre modeller.
Framtiden för läkemedelsutveckling
Forskningen, som har publicerats i tidskriften Matter, är ett samarbete mellan EPFL, National Centre of Competence in Research Catalysis (NCCR Catalysis) och b12 Labs. Synthegy är utformat för att fungera som en intelligent guide som tolkar och förfina beräkningsresultat genom ett enhetligt gränssnitt. Målet är att avsevärt påskynda både läkemedelsutveckling och design av nya kemiska reaktioner.

