Porównuje sekwencje wirusów. Darmowy program wynaleziony przez Polaków
Polscy naukowcy stworzyli program komputerowy o nazwie Vclust, który umożliwia porównanie milionów sekwencji wirusowych w zaledwie kilka godzin, porządkując je według stopnia podobieństwa. Tradycyjne metody analizy tak ogromnych zbiorów danych genetycznych mogłyby zająć nawet kilka lat.
W czasopiśmie "Nature Methods" opublikowano artykuł, w którym zespół naukowców z Wydziału Biologii Uniwersytetu im. Adama Mickiewicza w Poznaniu oraz Wydziału Automatyki, Elektroniki i Informatyki Politechniki Śląskiej, we współpracy z ekspertem z Uniwersytetu Friedricha Schillera w Jenie, przedstawił narzędzie umożliwiające rozróżnianie znanych wirusów od nowych. Jak podaje Polska Agencja Prasowa, narzędzie to pozwala także na analizę różnorodności wirusów w różnych środowiskach, co jest kluczowe dla monitorowania nowych patogenów oraz badań nad mikrobiomem.
Przy użyciu Vclust analiza zbioru 15 mln sekwencji zajmuje ok. czterech godzin, a najdokładniejsze narzędzia stosowane dotychczas potrzebowałyby na to ok. czterech lat. To istotny krok dla rozwoju wirusologii i metagenomiki, ponieważ ułatwi identyfikację i klasyfikację nowych wirusów, które w ostatnich latach są masowo odkrywane dzięki nowoczesnym technologiom sekwencjonowania
Naukowcy wskazali, że współczesna mikrobiologia stoi przed wyzwaniem związanym z ogromną ilością danych. Każdego roku odkrywa się nawet milion nowych wirusów, co prowadzi do powstawania tak obszernych zbiorów, że ich analiza i klasyfikacja staje się coraz trudniejszym zadaniem dla zespołów badawczych.
Dalsza część artykułu pod materiałem wideo
Bliskość i bezpieczeństwo - czas epokowych zmian? - Historie Jutra napędza PLAY #6
Jak zauważył, w biologii klasyfikacja organizmów, czyli taksonomia, zazwyczaj polega na porównywaniu specyficznych genów, które występują u wszystkich członków danej grupy. Dzięki temu możliwe jest tworzenie drzew filogenetycznych, grupowanie organizmów, wyodrębnianie rodzin czy gatunków oraz określanie ich stopnia pokrewieństwa. W przypadku wirusów sytuacja wygląda zupełnie inaczej.
Wirusy, w przeciwieństwie chociażby do bakterii, nie mają jednego wspólnego genu, który można by porównywać. Różnią się od siebie zbyt mocno. Dlatego klasyczne metody filogenetyczne nie działają. Nie sprawdziło się też podejście oparte na ich morfologii, np. kształcie kapsydów, które okazało się zbyt powolne i mało skalowalne. Pozostało nam więc jedno - porównywać sekwencje całych genomów, litera po literze
Trudno to zrobić, kiedy takich genomów są miliony. Jak wyjaśnił kierujący projektem prof. Sebastian Deorowicz z Politechniki Śląskiej, istnieją już narzędzia pozwalające grupować te olbrzymie zbiory danych, jednak robią to ogromnym kosztem obliczeniowym, trudnym do powtórzenia w warunkach codziennej pracy badawczej. "Nie jest tak, że nikt wcześniej tego nie zrobił, ale wymagało to tak dużych zasobów (np. superkomputerów), że trudno byłoby powtarzać ten proces regularnie, zwłaszcza gdy mamy do czynienia z coraz mocniej rozrastającymi się zestawami danych" - zaznaczył.
Twórcy Vclust zadbali o to, by narzędzie było w pełni darmowe i ogólnodostępne. Można je pobrać z internetu i uruchomić na własnym komputerze. Dla tych, którzy nie mają zaawansowanego sprzętu, przygotowano wersję przeglądarkową: vclust.org. Narzędzie działa w bardzo prosty sposób: użytkownik może wkleić własne sekwencje, uruchomić analizę i po krótkim czasie otrzymać wynik - bez potrzeby logowania czy rejestracji. Aktualnie wersja przeglądarkowa pozwala na analizę do tysiąca sekwencji jednocześnie, co w wielu przypadkach okazuje się w zupełności wystarczające.