Same dane świata nie zmienią. Ludzie muszą nauczyć się ich używać
- Dwie osoby idą na wernisaż sztuki współczesnej. Jedna jest jej znawcą, druga kompletnym laikiem. Obie mają oprzyrządowanie do mierzenia pulsu, przepływu krwi i napięcia mięśniowego. Sprawdzamy, jak reagują na wystawę - mówi ekspert ds. danych Kuba Piwowar. Obserwowani jesteśmy już w zasadzie wszędzie.
02.04.2019 | aktual.: 02.04.2019 09:35
10 i 30 zer, czyli 2,5 kwintyliona bajtów danych - tyle powstawało ich dziennie w zeszłym roku. Co z nimi robimy? Analizujemy, choć nie zawsze z głową. Posiadanie danych to jedno, ale ich użycie to zupełnie inna bajka. Jedną z osób, która zajmuje się zrozumieniem, co możemy zrobić z danymi, jest Kuba Piwowar. Analityk i socjolog, obecnie doktoryzuje się na Uniwersytecie SWPS. W rozmowie z WP Tech tłumaczy, co możemy zrobić z danymi, dlaczego chiński system rozpoznawania twarzy nas przeraża i dlaczego dane nie opisują jeszcze całego świata.
Życie na arkuszu
[Grzegorz Burtan, Wirtualna Polska] Mam opaskę, która mierzy mi jakość snu. Liczy, ile godzin spędzam w głębokim, a ile w płytkim śnie. Zacząłem zupełnie inaczej postrzegać kwestię spania.
[Kuba Piwowar] W jaki sposób?
Nie zacząłem myśleć, czy się wyspałem, ale ile spałem i czy miałem wystarczającą ilość głębokiego snu.
Ale wydaje ci się, że śpisz lepiej, czy naprawdę lepiej śpisz?
Jak widzę, że miałem dostatecznie dużo głębokiego snu, to od razu czuję się bardziej wyspany.
I chyba od tego warto zacząć: dlaczego ludzie zbierają dane na swój temat.
Dlaczego?
Z bardzo prostego powodu. Mając dane, możemy lepiej opisać jakieś zjawisko, a w konsekwencji zrozumieć je na głębszym poziomie. Mówiłeś o mierzeniu snu.
Najpierw naukowcy dowiedzieli się, że składa się z cykli po półtora godziny, które składają się na jeszcze mniejsze cykle. I wiadomo, że przespanie wielokrotności tych cykli gwarantuje nam dobry wypoczynek, a przerwanie jednego z nich w połowie może spowodować, że będziemy zmęczeni. Nawet jeśli długo spaliśmy. To wiedza, którą znamy z pomiarów, badań i obserwacji. To jeden aspekt.
A inny?
Powszechna wiedza ludzi, jak wykorzystywać dane i jak myślimy, jak pomagają nam w zarządzaniu swoją rzeczywistością. Mierzenie snu ma szansę zmienić podejście do snu, ale pod pewnym warunkiem.
Jakim?
Że zostanie im dostarczona wiedza, edukacja, metody do odczytywania tych danych. Wiemy, że się nie wysypiamy, to teraz musimy dowiedzieć się, co możemy zrobić, by jednak zacząć się wysypiać. Zbieranie danych ma sens wtedy, kiedy dają nam jakiś wgląd i pozwalają na rozwiązanie pewnych problemów.
Jako społeczeństwo wiemy, jak analizować dane?
Wydaje mi się, że to nie jest powszechna kompetencja. Zobaczmy, jak ludzie korzystają z takich słów, jak "większość" czy "90 proc". Często powołują się na pewne wyimaginowane liczby. Im się wydaje, że większość jakiejś populacji podziela jej zdanie. Poprawne wyciąganie wniosków jest niestety rzadko spotykane. Ten brak najlepiej widać w wynikach sondaży przedwyborczych.
Dlaczego?
Bo badanie preferencji wyborczych jest migawką pewnych nastrojów w momencie, kiedy zostało przeprowadzone. Ono nie jest wiążące. Może się wiele zmienić między badaniami, a samymi wyborami. I tu pojawia się pytanie – czy traktujemy liczby jako prawdę objawioną, czy pewną wskazówkę, która pomaga zrozumieć rzeczywistość
Ale to nie jest takie proste. Liczby są wszędzie. Jesteśmy bombardowani danymi. Czy nie wyłączamy się na ich widok? Tak jak na widok reklam z napisem "kup"?
Nie zgodziłbym się. Wezwanie do zakupu dalej działa, a co do danych, musimy mieć szerszy kontekst. Rozumienie danych i rzeczywistości jest różne dla różnych grup. Dla nas, młodych i stosunkowo obytych z technologiami ludzi, jest to oczywiste. Ale wyjedź kilometr za rogatki miasta. Elementy pomiarowe przestają mieć znaczenie, a przynajmniej w takiej formie, w jakiej objawiają się w środowiskach miejskich i bogatszych.
Na wsiach pomiary też są wykorzystywane, i to czasami na wielką skalę, ale zdarza się, że dochodzenie do wniosków na podstawie obserwacji, czyli zbierania danych, jest kompetencją niespisaną, ale wyuczoną. Mieszkanki wsi miewają lepszy zmysł analityczny, niż niejeden mieszczanin.
Historycznie, umówiliśmy się, że pewne rzeczy będziemy nazywać w konkretny sposób. Metr to 100 centymetrów, minuta to 60 sekund. Dzięki temu możemy efektywnie porównywać się z innymi i zarządzać swoimi zasobami. Pomiar jest jednym z fundamentów współczesnej umowy społecznej.
Nie ma w tym jakiegoś egzystencjalnego podtekstu? Że przerabianie wszystkiego na liczby daje nam poczucie większej kontroli nad nim?
Nie uważam tak. Człowiek opisuje rzeczywistość. Czasem językiem poezji, czasem Pythonem [językiem programowania - przyp. red.]. Użycie języka jest wtórne wobec rzeczywistości i celu jej opisywania. Wyobraźmy sobie taką sytuację. Dwie osoby idą na wernisaż sztuki współczesnej. Jedna jest jej znawcą, druga kompletnym laikiem. Obie mają oprzyrządowanie do mierzenia pulsu, przepływu krwi i napięcia mięśniowego. Sprawdzamy, jak reagują na wystawę.
I czego się dowiemy?
Znawca może uznać, że to beznadziejna wystawa, a laik będzie zachwycony, choć nie wie do końca, dlaczego. Pomiary ich tętna mogą wskazywać na pozornie identyczne rzeczy – podniesiony puls eksperta jest reakcją na złość lub zawód, a laika – na oniemienie. Ale dopiero głębokie zrozumienie całej opisywanej rzeczywistości pomaga nam kontekstualizować zbierane dane, wyciągać wnioski bliższe tak zwanej prawdzie.
Opisywanie rzeczywistości za pomocą danych jest możliwe, ale odczytywanie ich zapisu nie jest takie łatwe. Współczesny człowiek jest rzucony w świat, gdzie język danych jest przytłaczający. Jednocześnie jesteśmy pozbawieni umiejętności obsług tego świata. Mamy wielką konsolę do kontroli świata, ale nie wiemy, co robią poszczególne guziki.
Kuba Piwowar.
A dowiemy się?
Oczywiście. Potrzebujemy tylko gruntownej edukacji medialnej, kształcenia krytycznego myślenia, umiejętności weryfikacji źródeł, plusów i minusów przyjętej argumentacji.
Co nas trzyma w ryzach?
Mamy więcej danych, czy to po prostu naturalny rozwój naszej rzeczywistości?
Raczej to drugie. Przedsiębiorcy istnieją od zarania ludzkości. Kiedyś, by dotrzeć do klientów, wystawiali produkty przed dom. Teraz inaczej zdobywają tych klientów, na przykład przez internet. Dane zbierane były i wtedy, choć niekoniecznie przyjmowały formę ustrukturyzowanych baz danych – w małych społecznościach umieliśmy przypisać poszczególnym wręcz osobom ich profil zakupowy, albo komunikację, która ich nakłoni do zakupu. Dzisiaj, przy wielomilionowych grupach klientów, musimy wyciągać wnioski na podstawie olbrzymich zbiorów danych, choć – paradoksalnie – grupy, czy też: segmenty klientów i klientek pozostają w zasadzie niezmienione.
Liczby rządzą światem jeszcze bardziej?
Za pomocą języka liczb opisujemy coraz większe obszary rzeczywistości. Pamiętajmy jednak, że duże obszary pozostają dla nas niewidoczne.
Jak to?
W zeszłym roku połowa ludzkości miała dostęp do internetu. To oznacza, że połowa nie ma do niego dostępu. Opisując świat na podstawie danych cyfrowych, opisujemy bogatszą, białą, bardziej męską, lepiej wykształconą część świata.
Wyciągając wnioski z dowolnych danych należy pamiętać o tym, że, po pierwsze, to zawsze jest tylko pewne odwzorowanie rzeczywistości, którą opisujemy, a po drugie – opisujemy tylko jej fragment. Obserwowanie własnego doświadczenia oraz naszego otoczenia to dobry początek do zrozumienia świata, ale wyciąganie wniosków o nim na podstawie tak okrojonego obrazu narażone jest na duże ryzyko błędu. Warto o tym pamiętać, przeglądając treści w internecie, lub mijając ludzi na ulicy. Obserwujemy tylko wycinek świata, reszta agregowana jest na wyższych poziomach.
Czeka nas świat dwóch prędkości?
Nie sądzę – jeśli już mówimy o świecie dwóch prędkości, to teraz. Coraz więcej osób będzie miała dostęp do sieci. Bez wątpienia usieciowienie przyczyni się do transformacji społeczności, które podepną się do internetu, ale jeśli w jakiś sposób internet wpłynie na prędkość niepodłączonej dziś połowy ludzkości, to raczej pozytywnie.
Pytam, bo Mark Zuckerberg miał ambitny plan dostarczania internetu do miejsc bez niego za pomocą dronów. Co rodziło wątpliwości dotyczącego tego, kto będzie zarządzał danymi tych ludzi. A wiemy, że Facebook ma bardzo złą passę w tej kategorii, a "bezpieczeństwo" pada coraz częściej z ust prezesów i korporacji.
To prawda, coraz częściej będziemy o tym słyszeć. Tylko oprócz zapewnień, dobrze wiedzieć, jak możesz się dowiedzieć, co firmy o tobie wiedzą.
I od tego jest RODO. Na które mnóstwo ludzi narzekało.
Tutaj rodzi się pytanie, jakiej technologii chcemy. Czy mają być "uciążliwe", ale bezpieczniejsze, albo dostęp do danych byłby całkowicie niekontrolowany, za to pozornie wygodny i bezproblemowy.
Prywatność Państwa Środka
Na chińskim lotnisku możesz podejść do maszyny, która rozpozna twoją twarz i wskaże ci drogę do twojej bramki. Żadnych danych do wpisania. Jednych to zachwyca, drugich przeraża.
Mało tego, jeśli korzystamy ze współczesnych smartfonów, to nasze linie papilarne i twarz też są w bazach danych. Współczesne technologie rozpoznawania twarzy są dobrze rozwinięte. Jakiś czas temu na uniwersytecie Stanforda przeprowadzono mocno krytykowane badanie. Naukowcy mogli określić na podstawie zdjęcia twarzy orientację seksualną danej osoby.
Z jednej strony wizja takiej możliwości przeraża, bo wyobrażam sobie, że aplikacje takie mogą być wykorzystywane przez kraje, w których homoseksualizm jest karany, do inwigilacji i zastraszania obywateli.
Z drugiej strony pokazuje, jak wiele jeszcze pracy mają do wykonania sami badacze i badaczki, projektujący i publikujący badania co najmniej nieprzemyślane metodologicznie. Drobnych sygnałów i sposobów wykorzystania śladów cyfrowych i analogowych szukamy w wielu miejscach, ciekawią nas też sposoby implementacji nowych technologii na różnych polach.
To dobrze, bo to znaczy, że nauka się rozwija. Ale jej rozwój nie może odbywać się w oderwaniu od rzeczywistości społecznej i kulturowej.
To brzmi niepokojąco.
Zaczynamy dostrzegać, że technologie nie są obojętne społecznie, że rozmaite aplikacje czy też urządzenia mogą pośrednio lub bezpośrednio kształtować rzeczywistość – lub przynajmniej jej odbiór. Nie bez znaczenia pozostaje też fakt, że nie ma technologii dobrej na wszystko i wszędzie – różnimy się między sobą kulturowo, politycznie, historycznie, pod względem potrzeb, dążeń i sposobów radzenia sobie z rzeczywistością.
Rozumiem obawy i zdziwienie związane z tym, co się dzieje na przykład w Chinach. Ale nasze społeczeństwo i chińskie mają zupełnie inne podejście do prywatności i technologii.
Mam wrażenie, że podobny system miałby szansę zaistnieć u nas. Pod warunkiem, że za użycie maszyny dostawałbyś bon zakupowy.
To smutna diagnoza społeczeństwa i ja wierzę, że tak nie będzie. Nie wszyscy ludzie w Polsce są w programach lojalnościowych. Nie każdy Polak chętnie udostępnia swoje dane. Spójrzmy też na Niemców. To społeczeństwo bardzo świadome swojej prywatności. Google Street View to wielka biała plama w tym kraju.
Dlaczego?
Bo sobie nie życzą takiej technologii – z różnych przyczyn, głównie historycznych, mają ograniczone zaufanie do bycia rejestrowanym.
Co innego Daleki Wschód.
Uściślijmy, bo to kluczowe do zrozumienia pewnych różnic kulturowych. W naszej kulturze prywatność to prawo do zachowania informacji na swój temat tylko dla siebie. Tymczasem w Chinach ta definicja jest taka sama. Ale jeśli mieszkasz z rodzicami i zamykam drzwi do pokoju, to nie jest egzekwowanie mojego prawa do prywatności.
Tylko co?
Sygnał dla domowników, że chcesz coś ukryć, że nie jesteś wobec nich szczery. Kulturowo zamykanie drzwi w domu jest tam bardzo źle widziane, ponieważ przyjmuje się, że wszyscy sobie ufają. A zaufanie wynika z tego, że wszyscy na siebie patrzą. To, co dla nas jest porażającą ingerencją w naszą prywatność, tam jest jednym z przejawów działania rodziny albo – w rezultacie - państwa.
W ostatnich Avengersach Thanos, główny przeciwnik, ma obsesję na punkcie populacji. Jego celem jest wybicie połowy uniwersum, żeby zachować równowagę. I niektórzy widzowie uznali, że to sensowny plan. Ale czy problem nie leży w alokacji zasobów, a nie ich dostępności?
Jeśli dowolny analityk powiedziałby mi, że musimy wybić połowę ludzkości dla zachowania równowagi, to byłbym, powiedzmy ostrożny. Każdy projekt sugerujący zabicie kogoś jest z gruntu podejrzany. Nawet jeśli dane, które są używane w argumentacji, wydają się w porządku.
Poza tym dane są zawsze wykorzystywane i zbierane w jakimś kontekście. Nie ma czegoś takiego jak "surowe dane". Dodatkowo każda analiza i pomiar są obarczone marginesem błędu i pewne drobne zmienne mogą okazać się krytyczne dla ich interpretacji. Zalecam głęboką ostrożność przy takiej inżynierii społecznej.
Politpoprawny terror ratuje rowerzystów
Czy dane uratują świat?
Same na pewno nie. Dopiero umiejętność ich analizy może się przydać.
W jaki sposób
Podam przykład ze Szwecji. Kilka lat temu w jednej miejscowości, w ramach dyskusji zastanawiano się, czy odśnieżanie ulic ma aspekt płciowy.
Naprawdę?
Tak. To się wydaje jakimś absurdem politycznej poprawności, ale potem pojawiły się badania. Odśnieżanie jest bardzo uwikłane płciowo.
Jak to możliwe?
Zbadano, jaki wygląda podział płciowy na użytkowników rowerów i samochodów. Jednośladami jeździły najczęściej kobiety, samochodami mężczyźni. Z różnych przyczyn. Ważne było, kto częściej używał jakiego środka transportu.
I tutaj wracamy do odświeżania. Dla odśnieżarek ważniejsze były drogi, nikt nie myślał o ścieżkach rowerowych i chodnikach. W konsekwencji zanotowano duża liczbę wypadków rowerowych. Zmierzenie tego zjawiska spowodowało gigantyczne oszczędności.
Przez to, że zaczęto odśnieżać też ścieżki i chodniki.
Właśnie. Dzięki temu rowerzystki wywracały się znacznie rzadziej, rzadziej zatem trafiając do szpitala, żeby skorzystać z opieki zdrowotnej. Ale żeby dojść do takiego wniosku, trzeba wiedzieć, co mierzymy i jak to mierzymy, stawiać umiejętnie pytania, być ciekawym lub ciekawą, no i nie dać się danym oplątać i zbałamucić.