AI e farmaci: generate 5 milioni di molecole per accelerare le terapie

https://www.hdblog.it/tecnologia/articoli/n622392/intelligenza-artificiale-farmacologia/

HDblog.it Jun 19, 2025 · 2 mins read
AI e farmaci: generate 5 milioni di molecole per accelerare le terapie
Share this

Nel complesso e dispendioso mondo della ricerca farmacologica, uno dei passaggi più critici e laboriosi è comprendere se una potenziale molecola terapeutica sia in grado di legarsi efficacemente alla proteina giusta nel corpo umano. Questo processo, simile a trovare la chiave perfetta per una serratura specifica tra miliardi di combinazioni, determina se un farmaco potrà o meno modificare un processo biologico, come ad esempio l'avanzamento di una malattia. Tradizionalmente, questa fase si basa su lunghi e costosi esperimenti di laboratorio per analizzare migliaia di composti e le loro interazioni tridimensionali. Oggi, tuttavia, l'intelligenza artificiale sta aprendo orizzonti inesplorati per superare questi ostacoli.

In questo scenario si inserisce l'iniziativa di SandboxAQ, una startup nata da un progetto di Google e sostenuta da un colosso come NVIDIA. L'azienda ha recentemente reso pubblico un vastissimo archivio di dati, con l'obiettivo di fornire alla comunità scientifica uno strumento senza precedenti per accelerare le prime fasi della scoperta di nuovi farmaci. Questo immenso archivio, battezzato SAIR (Structurally Augmented IC50 Repository), non è una semplice raccolta di dati, ma un vero e proprio tesoro di oltre 5,2 milioni di co-strutture molecolari generate al computer. Ognuna di queste strutture sintetiche, che descrive l'interazione tra una proteina e una molecola farmacologica, è stata associata a dati reali sulla sua efficacia, o "potenza".

Per generare questa enorme mole di dati, che non sono stati osservati in laboratorio ma calcolati a partire da informazioni sperimentali esistenti, SandboxAQ ha impiegato la potenza dei chip NVIDIA e modelli di AI avanzati come Boltz-1x. Partendo da database pubblici, il team ha creato diverse pose tridimensionali per ogni coppia proteina-farmaco, per poi validarle e conservare solo quelle più accurate. Questo approccio risolve uno dei problemi principali per l'addestramento dei modelli di AI: la carenza di dati strutturali di alta qualità, spesso custoditi gelosamente dalle aziende farmaceutiche e raramente condivisi.

Rendendo il dataset SAIR liberamente accessibile, SandboxAQ offre ai ricercatori di tutto il mondo la materia prima per addestrare modelli di AI in grado di predire non solo la struttura, ma anche la potenza di un legame farmaco-proteina, con una velocità e su una scala prima inimmaginabili.

Sebbene il dataset sia gratuito, l'azienda prevede di commercializzare l'accesso ai propri modelli di AI proprietari, addestrati proprio su questa ricchissima base di conoscenza, con l'ambizione di offrire strumenti capaci di rivaleggiare con gli esperimenti di laboratorio in termini di accuratezza, ma in modo interamente virtuale e quasi istantaneo.