TED: Pierwsza rozproszona geograficznie baza danych

Wyobraź sobie bazę danych znajdującą się na kilku serwerach stojących powiedzmy w Londynie, Warszawie, Moskwie, Tokio i San Francisco. Nie synchronizowane bazy danych znajdujące się na różnych serwerach, nie kopie tej samej bazy – jedną relacyjną bazę danych znajdującą się fizycznie w wielu miejscach.

TED: Pierwsza rozproszona geograficznie baza danych
Źródło zdjęć: © Gizmodo.pl

27.07.2012 12:57

Właściwie nie trzeba sobie tego wyobrażać ponieważ wczoraj TransLattice pokazało bazę danych TED, czyli „TransLattice Elastic Database”.

-_ Przez ostatnie 15 lat próbowano rozwiązać problem rozproszonych baz danych _ - mówi wiceprezes TransLattice Louise Funke. - _ Nasze rozwiązanie jest wyjątkowe(…) to naprawdę baza danych, której dane znajdują się w różnych lokalizacjach _.

Celem przyświecającym założonej w 200. roku firmie, było stworzenie bazy danych, która mogłaby być dostępna cały czas, niezależnie od tego w jakim stanie znajdują się jej fragmenty. Bazy danych, która nie miałaby centralnego serwera i mogłaby sama odbudowywać stracone fragmenty danych. Taka hydra, której niestraszne są trzęsienia ziemi, powodzie oraz awarie elektrowni prądu. Ale jak to ma działać w praktyce?

Dane są dzielone w zależności od trzech czynników. Pierwszym jest polityka danej instytucji, która może sobie nie życzyć tego, by pewne dane znalazły się w węźle znajdującym się w konkretnym kraju. Drugim czynnikiem jest historia dostępu do danych –. zostaną one przerzucone tam gdzie najczęściej się z nich korzysta. Trzecim czynnikiem jest losowość – dane nigdy nie będą znajdowały się tylko na jednym węźle. Dane znajdują się więc zawsze na kilku węzłach, ale nigdy nie na wszystkich. Aktualnie baza danych TED może składać się z 12 węzłów, ale TransLattice pracuje nad tym, by w przyszłości zwiększyć ich liczbę.

Największym problemem, przed którym stanęli inżynierowie kalifornijskiej firmy, było opracowanie algorytmów, które zapewniłyby dostęp do danych z każdego węzła, nie zajmując jednocześnie całej przepływności łącz tylko i wyłącznie na zapewnienie komunikacji i przesyłanie danych pomiędzy węzłami. Wewnętrzna komunikacja pomiędzy węzłami bazy danych nie mogła zabić funkcjonalności.

- _ Nasz system jest wyjątkowy — monitorujemy komunikację pomiędzy węzłami by mieć dane na temat łącz i ich wykorzystania, więc kiedy system decyduje o przeniesieniu danych, przenoszone są one tam, gdzie się z nich korzysta. Potrafimy rozmieścić je tak, by osiągnąć maksymalną efektywność _ - mówi Funke.

Firma zapewnia, że nowy węzeł można uruchomić w ciągu 2. minut, a po podpięciu do sieci, pozostałe węzły rozpoznają do i w ciągu kilku następnych minut, TED zacznie zapełniać go danymi.

Pierwsi użytkownicy już dziś korzystają z baz danych TED. Użytkownicy z rodzaju tych, o których publicznie mało się mówi. Funke zdradza tylko, że mają „wielu klientów z sektora publicznego, związanych z obroną i wywiadem”. Ale nie tylko wywiad byłby zainteresowany tego typu bazami danych. Duże instytucje finansowe czy międzynarodowe korporacje również mogą skorzystać z tego rozwiązania. Wygląda więc na to, że trzy lata pisania algorytmów zwrócą się TransLattice z nawiązką.

internetwiadomościted
Wybrane dla Ciebie
Komentarze (1)