Powstaje największy dysk świata - pomieści 120 mln gigabajtów
Badacze z USA pracują nad największym na świecie dyskiem, mogącym przechowywać 120 petabajtów, czyli 120 mln gigabajtów danych - poinformował magazyn "Technology Review".
01.09.2011 | aktual.: 22.09.2011 13:35
Pojemność dysku, konstruowanego przez naukowców i inżynierowie z firmy IBM, pozwoli przechowywać 10-krotnie więcej danych niż konstruowane to tej pory rozwiązania dysków danych.
Nowy dysk może pomieścić około biliona plików lub 2. mld standardowych plików MP3 o rozmiarze 5 MB. Może też wykonać 60 kopii największego archiwum na świecie - Internet Archive's WayBack Machine - składającego się ze 150 mld stron.
Dysk danych IBM składa się z 20. tys. standardowych dysków twardych, zsynchronizowanych programowo i sprzętowo do równoczesnej i uzupełniającej się pracy. To rozwiązanie pamięci zostało wykonane dla konkretnego, nie ujawnionego z nazwy klienta, który konstruuje superkomputer badający w czasie rzeczywistym np. klimat czy zjawiska geologiczne.
W większości centrów danych dyski twarde umieszczone są na półkach w standardowych szafkach. Dyski w rozwiązaniu IBM są umieszczone zajmujących więcej miejsca szafach sprzętowych - muszą być chłodzone cieczą, nie przez zwykle używane w tym celu wentylatory.
Dane, zamieszczone na dysku danych, przechowywane są w wielu kopiach na dyskach twardych. Firma IBM opracowała jednak własne rozwiązania, zabezpieczające przed skutkami awarii dysków składowych. Kiedy przestanie pracować jeden z dysków twardych, kopie danych z niego są wgrywane na inne dyski składowe w wolnym tempie tak, aby kopiowanie nie zajmowało mocy procesorów i nie spadała szybkość działania superkomputera. Jeśli awaria obejmie kilka blisko położonych dysków, szybkość kopiowania danych rośnie, aby uniknąć możliwość rozszerzenia błędów na inne dyski i zniknięcia jakichkolwiek danych i ich kopii z systemu.
Inny jest też zastosowany przez IBM system plików. Rozwiązanie opracowane przez naukowców z Almaden Labs używa systemu GPFS, umożliwiającego szybki dostęp do danych. Według naukowców z IBM, system plików GPFS umożliwia zindeksowanie 1. mln plików w 43 minuty.
Jak powiedział "Technology Review" Bruce Hillsberg - dyrektor badań nad przechowywaniem danych w IBM, tego typu dyski danych można oczywiście stosować także w zastosowaniach komercyjnych. Jak dodał, ilość danych, gromadzonych czasie przetwarzania w chmurze komputerowej, które to rozwiązanie zaczyna wypierać pracujące do tej pory systemy, działające rozdzielnie - zarówno naukowe, jak i komercyjne - niedługo wymagać będzie takich dysków danych. Według niego, przy 12. PB dysku danych, sam opis plików, ich ścieżek i właściwości plików umieszczonych w systemie zajmuje 2 PB.
Według wiceprezesa ds. analiz w firmie analitycznej IDC Steve Conwaya, największe do tej pory budowane systemy składowania danych miały pojemność 15 PB. Jego zdaniem, takie rozwiązania, jak zaprojektowane przez IBM, mogą służyć w badaniach nad genomem ludzkim, w badaniach procesów sejsmicznych, studiach nad rodzajami białek, przy tworzeniu modelu odporności organizmu oraz budowaniu modeli przewidywania pogody.