L’azienda di intelligenza artificiale DeepMind annuncia di aver risolto uno dei grandi problemi della biologia molecolare: la forma tridimensionale delle proteine
La “vecchia scuola” prevede il ricorso a metodi sperimentali come la cristallografia a raggi X: un sistema lungo e laborioso, ma l’unico a disposizione per comprendere la struttura tridimensionale delle proteine. Queste macromolecole svolgono praticamente tutte le funzioni all’interno degli organismi viventi e sono formate da lunghe catene di amminoacidi. Il problema è che queste catene non sono piatte, ma assumono forme tridimensionali anche molto complesse e svolgono la loro funzione biologica proprio grazie a questa struttura. Una sorta di complicatissimo origami impossibile da determinare conoscendo solo la sequenza di amminoacidi, la cosiddetta struttura primaria che è poi quella che possiamo ricavare dal Dna: i calcoli sono troppo complessi.
Da qui l’idea di utilizzare l’intelligenza artificiale, per la precisione sistemi di apprendimento automatico che, invece di calcolare le possibili forme che la catena di amminoacidi può assumere, imparano a trovare la soluzione con dei dati di esempio (in questo caso circa 170mila proteine la cui struttura era già nota). Ci si lavora dagli anni Novanta, e adesso DeepMind, azienda di proprietà di Google, sarebbe riuscite nell’impresa. Il condizionale è d‘obbligo per un paio di motivi: il primo è che al momento abbiamo solo l’annuncio di DeepMind e un minimo di cautela è necessario prima che i dati vengano analizzati (tra l’altro nei limiti di eventuali brevetti) per una vera e propria pubblicazione scientifica. Il secondo motivo è che rimangono comunque dei limiti: AlphaFold, questo il nome del sistema, arranca quando ci sono interazioni tra più proteine.
La scoperta promette una rivoluzione nella ricerca biomedica, permettendo ad esempio di identificare più velocemente possibili farmaci.