MaxDIA: Taking proteomics to the next level

ENG: A new software improves data-independent acquisition proteomics by providing a computational workflow that permits highly sensitive and accurate data analysis. Proteins are essential for our cells to function, yet many questions about their synthesis, abundance, functions, and defects still remain unanswered. High-throughput techniques can help improve our understanding of these molecules. For analysis by liquid chromatography followed by mass spectrometry (MS), proteins are broken down into smaller peptides, in a process referred to as “shotgun proteomics.” The mass-to-charge ratio of these peptides is subsequently determined with a mass spectrometer, resulting in MS spectra. From these spectra, information about the identity of the analyzed proteins can be reconstructed. However, the enormous amount and complexity of data make data analysis and interpretation challenging.

Protein ratio distributions in the four species. Credit: Max-Planck-Gesellschaft

Two main methods are used in shotgun proteomics: Data-dependent acquisition (DDA) and data-independent acquisition (DIA). In DDA, the most abundant peptides of a sample are preselected for fragmentation and measurement. This allows to reconstruct the sequences of these few preselected peptides, making analysis simpler and faster. However, this method induces a bias towards highly abundant peptides. DIA, in contrast, is more robust and sensitive. All peptides from a certain mass range are fragmented and measured at once, without preselection by abundance.

Jürgen Cox and his team have now developed a software that provides a complete computational workflow for DIA data. It allows, for the first time, to apply algorithms to DDA and DIA data in the same way. Consequently, studies based on either DDA or DIA will now become more easily comparable. MaxDIA analyzes proteomics data with and without spectral libraries. Using machine learning, the software predicts peptide fragmentation and spectral intensities. Hence, it creates precise MS spectral libraries in silico. In this way, MaxDIA includes a library-free discovery mode with reliable control of false positive protein identifications.

RO: Un nou software îmbunătățește proteomica de achiziție independentă de date prin furnizarea unui flux de lucru computațional care permite o analiză a datelor foarte precisă. Proteinele sunt esențiale pentru funcționarea celulelor noastre, însă multe întrebări despre sinteza, abundența, funcțiile și defectele acestora rămân încă fără răspuns. Tehnicile de mare randament pot contribui la îmbunătățirea înțelegerii noastre despre aceste molecule. Pentru analiza prin cromatografie lichidă urmată de spectrometrie de masă (SM), proteinele sunt descompuse în peptide mai mici, într-un proces denumit “shotgun proteomics”. Raportul masă-încărcare al acestor peptide este determinat ulterior cu un spectrometru de masă, rezultând spectrele SM. Din aceste spectre, pot fi reconstruite informații despre identitatea proteinelor analizate. Cu toate acestea, cantitatea enormă și complexitatea datelor fac ca analiza și interpretarea datelor să fie o provocare.

Două metode principale sunt utilizate în proteomica shotgun: Achiziția dependentă de date (ADD) și achiziția independentă de date (AID). În ADD, cele mai abundente peptide ale unei probe sunt preselectate pentru fragmentare și măsurare. Acest lucru permite reconstruirea secvențelor acestor câteva peptide preselectate, ceea ce face ca analiza să fie mai simplă și mai rapidă. Cu toate acestea, această metodă induce o prejudecată în favoarea peptidelor foarte abundente. AID, în schimb, este mai robustă și mai sensibilă. Toate peptidele dintr-un anumit interval de masă sunt fragmentate și măsurate deodată, fără preselecție în funcție de abundență.

Jürgen Cox și echipa sa au dezvoltat acum un software care oferă un flux de lucru complet de calcul pentru datele AID. Acesta permite, pentru prima dată, aplicarea algoritmilor la datele ADD și AID în același mod. Prin urmare, studiile bazate pe cele două tipuri de achiziții vor deveni acum mai ușor de comparat. Metoda analizează datele proteomice cu și fără biblioteci spectrale. Folosind învățarea automată, software-ul prezice fragmentarea peptidelor și intensitățile spectrale. Prin urmare, acesta creează biblioteci spectrale SM precise. În acest fel, MaxDIA include un mod de descoperire fără bibliotecă, cu un control fiabil al identificărilor de proteine fals pozitive.

Source (Max-Planck-Gesellschaft. “MaxDIA: Taking proteomics to the next level.” ScienceDaily. ScienceDaily, 12 July 2021.)

Paper: Sinitcyn, P., Hamzeiy, H., Salinas Soto, F., Itzhak, D., McCarthy, F., Wichmann, C., Steger, M., Ohmayer, U., Distler, U., Kaspar-Schoenefeld, S. and Prianichnikov, N., 2021. MaxDIA enables library-based and library-free data-independent acquisition proteomics. Nature Biotechnology, pp.1-11.