MENU

Vědci z ÚOCHB vytvářejí historicky největší knihovnu neznámých chemických látek

Vědci z ÚOCHB vytvářejí historicky největší knihovnu neznámých chemických látek
Pro měření dat do spektrální knihovny se používá pipetovací robot, který připraví směsi deseti látek do destiček.

Vědci z laboratoře Dr. Tomáše Pluskala z Ústavu organické chemie a biochemie AV ČR (ÚOCHB) pomáhají kolegům z celého světa poznávat dosud neznámé látky. Vytvořili rozsáhlou knihovnu MSⁿLib, která obsahuje několik milionů záznamů o tom, jak se malé molekuly „rozpadají“ při měření metodou hmotnostní spektrometrie. Zatím se podobné databáze rozrůstaly jen velmi pomalu. Díky novému unikátnímu postupu z ÚOCHB lze teď údaje o neznámých molekulách získat v řádu minut. To je potenciál pro rychlejší hledání nových léčiv, lepší monitorování chemických látek v životním prostředí nebo pro další rozvoj umělé inteligence v oblasti biomedicíny. Článek zveřejnil prestižní vědecký časopis Nature Methods.

Hmotnostní spektrometrie odhaluje složení chemických látek a je klíčovým nástrojem v medicíně, farmacii nebo při výzkumu životního prostředí. Přístroj dokáže rozdělit neznámou látku na menší části a z těchto fragmentů odvodit, jak vypadala původní molekula. Spektra fragmentů, která si můžeme představit jako otisk prstu jedinečný pro každou látku, se porovnávají s už známými spektry uloženými v knihovnách. Dosavadní databáze ale pokrývaly jen omezený počet známých látek, což pátrání značně ztěžovalo.

Tomáš Pluskal a jeho tým rozvoj spektrálních knihoven posunuli významně kupředu. V době, kdy zpracovali svou studii pro Nature Methods, dali dohromady katalog třiceti tisíc malých molekul. K nim naměřili dva miliony velmi kvalitních spekter a nespokojili se přitom jen s hrubým obrázkem. Vícestupňovou fragmentací (MSⁿ), tedy opakovaným rozbíjením molekul, získali detailnější obraz o jejich vnitřní stavbě. Takto komplexní soubor dat má vědecký svět k dispozici poprvé. Tomáš Pluskal vysvětluje: „Během dvaceti let, kdy se pohybuji v oboru, se knihovny spekter příliš nerozrůstaly. Tuhle praxi jsme dokázali změnit až my a vytvořili jsme dosud největší databázi, která v současnosti existuje. Navíc jsme ji zpřístupnili světové vědecké komunitě k volnému využití.

Vědci také podstatně urychlili samotnou analýzu látek. Dokážou měřit vždy deset látek najednou a celý proces zabere pouhou minutu a půl. Protože je Pluskalův tým ve světové vědecké komunitě mimořádně známý a aktivní, získal od různých firem a institucí darem tisíce různých látek. „Od sepsání článku v Nature Methods jsme se posunuli zase o kus dál. Dosud jsme zpracovali na 70 tisíc látek a dalších 150 tisíc jich čeká na analýzu. Data dál nahráváme na internet a do konce roku bychom se chtěli dostat na 200 tisíc naměřených látek. To je zhruba desetkrát víc, než bylo k dispozici za posledních 20 let.“, říká první autorka článku, Dr. Corinna Brungs, která nyní působí jako vedoucí servisní skupiny na Vídeňské univerzitě.

Tomáš Pluskal s kolegy využívají obrovské množství nových dat také k tomu, aby vylepšili algoritmy AI, které samostatně rozeznávají neznámé chemické látky od metabolitů v lidském těle až po látky v rostlinách či mikroorganismech. Vědci „nakrmí“ chytrý model strojového učení daty z knihovny chemických látek a díky větší datové základně dokáže jejich model na základě dodaného spektra přesněji popsat, jak by mohla vypadat molekula, která použité spektrum obsahuje.

Knihovnu spekter podporuje open-source software mzmine, za jehož rozvojem stojí rovněž tým kolem Tomáše Pluskala umožňující automatizované zpracování obrovského množství měření. Díky tomu vznikl zdroj, který je nejen rozsáhlý, ale i snadno použitelný pro další vědecké projekty po celém světě.

Původní článek: Brungs, C., Schmid, R., Heuckeroth, S., Mazumdar, A., Drexler, M., Šácha, P., Dorrestein, P. C., Petras, D., Nothias, L., Veverka, V., Nencka, R., Kameník, Z., & Pluskal, T. (2025). MSnLib: efficient generation of open multi-stage fragmentation mass spectral libraries. Nature Methods. https://doi.org/10.1038/s41592-025-02813-0

Video reportáž.

Zdroj: Ústav organické chemie a biochemie AV ČR