Badacz danych - czym jest najbardziej pożądany zawód tego dziesięciolecia?
Big Data Scientist, czyli badacz danych, to zdaniem Hala Variana, głównego ekonomisty Google, najbardziej pożądany zawód w tej dekadzie. Według Oracle do 2020 roku internet rozrośnie się do 45 ZB (zettabajtów) danych. Obecnie liczy około 6 ZB. Żeby to wszystko przetworzyć i przeanalizować potrzebni będą właśnie badacze danych. Niestety – rynek wciąż zmaga się z deficytem specjalistów. W samych tylko Stanach Zjednoczonych do 2020 roku deficyt może sięgnąć nawet 4 mln wolnych stanowisk.
Cyfrowi czarodzieje
Za ojców terminu „Big Data Scientist” uznaje się Jeffa Hammerbachera oraz D.J. Patila, którzy ukuli tę nazwę ponad siedem lat temu. Badacz danych to pracownik, którego wiedza jest kompilacją wiadomości z zakresu ekonomii, matematyki, statystyki, behawioryzmu oraz nowych technologii. Właśnie do tych nauk nawiązuje termin „scientist”. (naukowiec, badacz), używany w nazwie tego zawodu. Po latach Hammerbacher i Patil zostali zaliczeni przez amerykański magazyn Forbes do grona siedmiu najbardziej wpływowych „badaczy danych” na świecie.
„Badacz danych” to młody zawód, który nie zdołał jeszcze zakorzenić się w powszechnej świadomości. Według badania LinkedIn w 2008 roku żaden z użytkowników tej sieci społecznościowej nie pracował jako Big Data Scientist. Za to w 2013 roku tę profesję wpisało w swoich profilach 3440 użytkowników portalu. Dzisiaj to jeden z najczęściej poszukiwanych zawodów w Dolinie Krzemowej.
Kim są "badacze danych"?
– Specjaliści od Big Data to pracownicy sektora gospodarki cyfrowej, kluczowej gałęzi w ekonomii społeczeństw postindustrialnych, w których główną rolę odgrywa informacja. Odpowiadają oni za pozyskiwanie, analizowanie, segmentowanie i interpretowanie informacji, jakie internauci pozostawiają po sobie w sieci. A tych informacji jest całkiem sporo – kilkanaście petabajtów (tysięcy terabajtów) danych na sekundę. Zadaniem badaczy danych jest odnalezienie w tym gąszczu wskaźników takich informacji, które będzie można później przekuć w wiedzę albo zmonetyzować. Słowem: badacze danych to specjaliści od cyfrowych hieroglifów, którzy wiedzą, jak zasoby świata cyfrowego możemy wykorzystać do usprawnienia naszego codziennego życia online i offline –. tłumaczy Piotr Prajsnar, szef Cloud Technologies, prezes największej platformy Big Data w naszej części Europy.
Niestety, wykwalifikowanych badaczy danych na rynku jest jak na lekarstwo. Dlatego, jak przekonuje Josh Sullivan, lider niemal pół tysięcznej grupy „badaczy danych”. w firmie konsultingowej Booz Allen Hamilton, przedsiębiorcy toczą o nich regularną wojnę. Użytkownicy, w których profilu zawodowym na LinkedIn widnieje wpis „data scientist”, otrzymują od rekruterów nawet sto maili dziennie z propozycją zmiany pracy.
Dlaczego badacze danych są tak łakomym kąskiem na celowniku headhunterów?
Według raportu autorstwa McKinsey Global Institute już teraz „Big Data Scientist”. jest jednym z najbardziej pożądanych zawodów w USA. Za pięć lat na amerykańskim rynku zapotrzebowanie na specjalistów od badania danych na kierowniczych stanowiskach sięgnie nawet 1,5 mln, a cały deficyt stanowisk powiązanych z Big Data – nawet 4 mln nieobsadzonych stanowisk.
Magister z Big Data
Ten niedobór dostrzegły uczelnie wyższe i w odpowiedzi na alarmujące sygnały spływające ze środowisk biznesowych wdrożyły do swojej oferty edukacyjnej studia dedykowane zagadnieniom Big Data. Przykładowo –. Uniwersytet w Iowa uruchomił w 2013 roku kierunek Analityka Biznesowa i Systemy Informacyjne. Na pierwszy rok studiów zapisało się ponad 170 studentów.
Również w Polsce rynkowa luka w zawodzie badaczy danych powoli staje się wyczuwalna. Już obecnie na portalach z ogłoszeniami o pracę coraz więcej rekruterów poszukuje osób z doświadczeniem w Big Data. Zapotrzebowanie na nich zgłasza sam biznes: według badania autorstwa InsightExpress 8 na 1. polskich menedżerów IT sądzi, że analityka Big Data stanowiła będzie trzon strategii ich przedsiębiorstw w ciągu najbliższych pięciu lat. Polskie uczelnie nie zamierzają przespać tego czasu i chcą wykorzystać ten rynkowy potencjał. Szkoła Główna Handlowa w październiku zeszłego roku uruchomiła pierwszą edycję dwusemestralnych studiów podyplomowych: Inżynieria Danych – Big Data. Podobnie Instytut Podstaw Informatyki PAN zachęca do podjęcia studiów podyplomowych na kierunku „Metody i narzędzia nowoczesnej analizy danych w biznesie”. Z kolei Politechnika Warszawska od 2012 organizuje seminaria poświęcone tematyce Big Data. W polskiej nauce pierwsze oznaki zainteresowania potencjałem tej branży są już widoczne.
Być może Big Data Scientist będzie niebawem wymieniany jednym tchem obok tak kluczowych dla rynku profesji jak prawnik, chirurg czy dentysta. Pokusą jest tutaj nie tylko chłonny rynek, lecz także sowite zarobki.
Big Data = Big Money?
Frank J. Ohlhorst, dziennikarz IT, który zaczął zajmować się tematyką Big Data zanim jeszcze stało się to modne, w swojej książce „Turning Big Data into Big Money”. przywołał zasadę 4V, za sprawą której Big Data może (ale wcale nie musi) generować Big Money, czyli wielkie pieniądze.
– Te 4V, które wymienia się w kontekście Big Data, to: *Volume *– czyli ogromna ilość danych, *Variety *– ogromna ich różnorodność, *Veracity *– wiarygodność danych oraz *Velocity *–. zawrotna szybkość ich generowania. Te cztery czynniki składają się na wartość danych, w sensie zarówno merytorycznym jak i czysto finansowym – wyjaśnia Łukasz Kapuśniak, Chief Big Data Officer w Cloud Technologies.
Ohlhorst jednak nie odpowiedział wprost na pytanie: ile można zarobić na danych? Pokazuje raczej, na czym należy się skupić, żeby móc na nich zarobić. Mimo to można podać pewne szacunki zarobkowe branży Big Data. Przynajmniej w kolebce tej technologii, czyli w Stanach Zjednoczonych.
O oszacowanie średnich wynagrodzeń badaczy danych w USA pokusił się portal DataJobs. Według jego analityków zarobki specjalisty ds. Big Data wahają się w granicach 50 tys. USD – 75 tys. USD. W przypadku doświadczonych analityków mówimy już o widełkach cenowych rzędu 6. tys. USD – 110 tys. USD. Z kolei według Burtch Works mediana zarobków badacza danych ze stażem do 3 lat, który może pochwalić się dyplomem uniwersyteckim, dobrą znajomością języków programowania oraz metod statystycznych, wynosi 80 tys. USD. Ci, którzy pracują w branży dłużej mogą liczyć nawet na 150 tys. USD.
Czy to już “Big Money”? Zależy jak na to patrzeć. W USA są to zarobki, które stoją w tym samym rzędzie co pensje lekarzy czy prawników, a także wyspecjalizowanych programistów.
Big Data w PLN
Big Data można oczywiście przeliczyć na złotówki, jednak nie bez problemów. W Polsce podstawowej trudności przysparza fakt, że zawód badacza danych jest jeszcze u nowy, a w związku z tym brakuje – nomen omen – danych do przedstawienia wiarygodnych statystyk. W dostępnych raportach płacowych zawody takie jak Big Data Scientist czy Big Data Architect praktycznie nie występują. Powodem jest m.in. niewielka liczba pracowników tego sektora, których kwalifikuje się często do tej samej grupy wynagrodzeń, co np. programistów. W ustaleniu miarodajnych wyników nie pomaga również często znacząca rozpiętość widełek płacowych. Jednak sporządzenie takich wyników jest tylko kwestią czasu, bowiem popularność Big Data w kraju nad Wisłą rośnie lawinowo. Dowodem są choćby raporty giełdowych spółek, pełniące funkcję papierka lakmusowego tego wciąż kształtującego się rynku.
Prześwietlając raport Cloud Technologies, warszawskiej spółki IT zajmującej się analityką i monetyzacją wielkich zbiorów danych, można wysnuć wniosek, że Big Data w naszym kraju wkracza właśnie w swój złoty okres. Spółka Piotra Prajsnara wyrosła na największą platformę danych w tej części Europy, a w tym roku zajęła szóste miejsce w rankingu Deloitte Technology Fast 50 CEE w kategorii „Rising Stars”. Po III kwartałach 2015 roku przychody ze sprzedaży usług warszawskiej spółki przekroczyły 23,1 mln zł, a zysk netto sięgnął 10,5 mln zł. To ponad dwukrotnie więcej niż w analogicznym okresie 2014 roku. To także spółka związana z Big Data kolejny raz okazała się żyłą złota dla giełdowych inwestorów: od początku roku jej notowania na NewConnect wzrosły o ponad 100 proc. Na początku 2015 za pakiet akcję płacono około 45 zł – obecnie jej wartość zbliża się nawet do 100 zł. W listopadzie padł rekord: 110 zł za akcję. Te liczby dają pewien obraz tego, ile można zarobić na Big Data nad Wisłą.
Epoka Big (Smart) Data
W 200. roku Dr Vinton G. Cerf z Google, znany jako „ojciec internetu”, zapowiadał nadejście czasów, w których koniecznością stanie się poznanie osoby po drugiej stronie kabla po to, by lepiej zrozumieć ją i jej potrzeby. Te czasy już nadeszły.
Dane wskazują, że każdego dnia Google przetwarza już ponad 24 petabajty danych. Twitter z roku na rok powiększa swoją objętość blisko trzykrotnie. W każdej sekundzie na YouTube 800 mln użytkowników dodaje godzinę nowych filmów. Na Facebooka co godzinę przesyłanych jest blisko 10 mln nowych fotografii, a każdego dnia jego użytkownicy dokonują blisko 3 miliardów rozmaitych aktywności: od komentarzy po udostępnienia i kliknięcia „lubię to”. Według Google w ciągu 48 godzin produkujemy w internecie więcej danych niż od początku powstania cywilizacji do 2003 roku.
–. Nie o ilość danych jednak chodzi. Bardziej podstawową kwestią jest ich rozdzielczość czy jakość, a więc to, co można z ich pomocą zrobić. Wówczas na pierwszym planie pojawia się pojęcie „smart data”, czyli danych już uporządkowanych i zinterpretowanych, pogrupowanych w profile behawioralne (profile zachowań) użytkowników internetu. To dane, które przeszły przez warsztat wytrawnego badacza i stanowią solidną podstawę nie tylko do zbudowania konkretnej strategii komunikacyjnej, ale też do personalizacji sieci – mówi Łukasz Kapuśniak, analityk internetowy.
Ilość danych generowanych w sieci jest gigantyczna, a ich przetworzenie przekracza możliwości tradycyjnych, konwencjonalnych systemów klasyfikujących w firmach. Mimo tego wykorzystywana strategicznie jest stosunkowo niewielka część z nich – według IDC jest to raptem 20 proc. W ciągu najbliższych lat mamy jednak wykorzystywać biznesowo 30 proc. zasobów generowanych w sieci. Mimo znaczącego wzrostu, to wciąż mało i wartość tę trzeba wciąż zwiększać. A to oznacza tytaniczną pracę oraz to, że stanowiska typu „Big Data Scientist” czy „Big Data Architect” będą zyskiwały na popularności coraz szybciej.