ENG: A team led by University of Washington School of Medicine researchers developed powerful new protein design software adapted from a strategy proven adept at board games like chess and Go. The research is a milestone in tapping artificial intelligence to conduct protein science research. The potential applications are vast, from developing more effective cancer treatments to creating new biodegradable textiles. The authors foresee a future in which this approach could enable them and others to create therapeutic proteins, vaccines, and other molecules that could not have been made using prior methods.
Reinforcement learning is a type of machine learning in which a computer program learns to make decisions by trying different actions and receiving feedback. Such an algorithm can learn to play chess, for example, by testing millions of different moves that lead to victory or defeat on the board. The program is designed to learn from these experiences and become better at making decisions over time.
To make a reinforcement learning program for protein design, the scientists gave the computer millions of simple starting molecules. The software then made ten thousand attempts at randomly improving each toward a predefined goal. The computer lengthened the proteins or bent them in specific ways until it learned how to contort them into desired shapes.
As part of this study, the scientists manufactured hundreds of AI-designed proteins in the lab. Using electron microscopes and other instruments, they confirmed that many of the protein shapes created by the computer were indeed realized in the lab. The team concentrated on designing new nano-scale structures composed of many protein molecules. This required designing both the protein components themselves and the chemical interfaces that allow the nano-structures to self-assemble. As a measure of how accurate the design software had become, the scientists observed many unique nano-structures in which every atom was found to be in the intended place. In other words, the deviation between the intended and realized nano-structure was on average less than the width of a single atom. This is called atomically accurate design.
RO: O echipă condusă de cercetătorii de la Facultatea de Medicină a Universității din Washington a dezvoltat un nou și puternic software de proiectare a proteinelor, adaptat după o strategie care s-a dovedit a fi bună la jocuri de societate precum șahul și Go. Cercetarea reprezintă o nouă etapă în exploatarea inteligenței artificiale pentru a efectua cercetări în domeniul științei proteinelor. Aplicațiile potențiale sunt vaste, de la dezvoltarea unor tratamente mai eficiente împotriva cancerului până la crearea de noi textile biodegradabile. Autorii prevăd un viitor în care această abordare le-ar putea permite lor și altora să creeze proteine terapeutice, vaccinuri și alte molecule care nu ar fi putut fi realizate cu ajutorul metodelor anterioare.
Învățarea prin întărire este un tip de învățare mecanică în care un program de calculator învață să ia decizii prin încercarea unor acțiuni diferite și primirea de feedback. Un astfel de algoritm poate învăța să joace șah, de exemplu, prin testarea a milioane de mișcări diferite care duc la victorie sau înfrângere pe tablă. Programul este conceput să învețe din aceste experiențe și să devină mai bun în timp.
Pentru a realiza un program de învățare prin întărire pentru proiectarea proteinelor, oamenii de știință au dat computerului milioane de molecule simple de pornire. Apoi, software-ul a făcut mii de încercări de îmbunătățire aleatorie a fiecăreia spre un obiectiv predefinit. Calculatorul a alungit proteinele sau le-a îndoit în moduri specifice până când a învățat cum să le contureze în formele dorite.
În cadrul acestui studiu, oamenii de știință au fabricat în laborator sute de proteine proiectate de inteligența artificială. Folosind microscoape electronice și alte instrumente, ei au confirmat că multe dintre formele de proteine create de calculator au fost într-adevăr realizate în laborator. Echipa s-a concentrat pe proiectarea unor noi structuri la scară nanometrică compuse din mai multe molecule de proteine. Acest lucru a necesitat proiectarea atât a componentelor proteice în sine, cât și a interfețelor chimice care permit nano-structurilor să se autoasambleze. Ca o măsură a gradului de acuratețe a software-ului de proiectare, oamenii de știință au observat multe nanostructuri unice în care fiecare atom se afla la locul dorit. Cu alte cuvinte, abaterea dintre nanostructura dorită și cea realizată a fost în medie mai mică decât lățimea unui singur atom. Acest lucru se numește proiectare precisă din punct de vedere atomic.
Source (UW Medicine Newsroom, “Reinforcement learning: from board games to protein design”, 20.04.2023)
Paper: Lutz, I.D., Wang, S., Norn, C., Courbet, A., Borst, A.J., Zhao, Y.T., Dosey, A., Cao, L., Xu, J., Leaf, E.M. and Treichel, C., 2023. Top-down design of protein architectures with reinforcement learning. Science, 380(6642), pp.266-273.