Nawet 30 tysięcy wpisów dziennie! Oto co pozostawiły po sobie Światowe Dni Młodzieży 2016
Zakończono analizę wydźwięku postów na Facebooku i Twitterze w czasie Światowych Dni Młodzieży Kraków 2016. W lipcu w serwisie Twitter pojawiło się 300 tysięcy wiadomości na temat samego wydarzenia i prawie 1,5 mln wpisów na temat Polski i Krakowa. W porównaniu,
w znacznie dłuższym okresie, bo od początku roku, na oficjalnym profilu ŚDM na Facebooku Internauci umieścili niemal 1000 postów.
Analiza wydźwięku, przygotowana przez ekspertów z Laboratorium Oprogramowania IBM, pozwoliła na prześledzenie postów i krótkich wypowiedzi dotyczących wydarzenia w internecie. Dzięki niej, codziennie podczas trwania Światowych Dni Młodzieży analizowane były między innymi informacje, jakie tematy interesują użytkowników, w jakich językach piszą, a także gdzie się znajdują.
I tak, najwięcej publikacji na Twitterze pojawiło się w trakcie trwania samego wydarzenia (średnio około 3. tysięcy dziennie). W tygodniu poprzedzającym informacje pojawiały się czterokrotnie rzadziej. Na Facebooku oprócz liczby wpisów przeanalizowano, jak wiele z nich zyskuje popularność wśród internautów. Tu najwięcej polubień i udostępnień miały wpisy dotyczące pojawienia się papieża Franciszka w oknie na ulicy Franciszkańskiej 3 w Krakowie.
Pierwsze tweety pojawiły się na długo przed rozpoczęciem ŚDM w Ameryce Środkowej (między innymi w Panamie, która będzie gościć pielgrzymów za trzy lata). Z czasem rozćwierkała się cała Ameryka Południowa i Europa oraz wschodnie wybrzeże Stanów Zjednoczonych. Niewielka liczba tweetów pochodziła z Afryki (Ghana i Zimbabwe). Na obszarze Polski najwięcej osób dzieliło się informacjami na temat ŚDM na południu kraju, a także w większych miastach - Warszawie, Poznaniu, Łodzi oraz w Trójmieście. Sądząc po czasie (przed rozpoczęciem wydarzenia w Krakowie) oraz języku, w jakim napisane były publikacje, część z nich to pielgrzymi, którzy przybyli na spotkania w diecezjach. Na mapach analitycznych widać, że Portugalczycy i Hiszpanie zawitali np. do Trójmiasta.
Wśród tematów najczęściej komentowanych w internecie znalazły się: msza rozpoczynająca Światowe Dni Młodzieży (wtorek), przyjazd papieża Franciszka do Krakowa i jego spotkania z pielgrzymami (środa i czwartek), droga krzyżowa na Błoniach (piątek), czuwanie w Brzegach (sobota) oraz podziękowania pielgrzymów i zaproszenia na kolejne spotkanie w Panamie (niedziela).
Na uwagę zasługuje fakt, że w lipcu ukazywało się około 250-30. tysięcy tweetów tygodniowo związanych z Polską i Krakowem. Polska zyskała więc większą popularność w mediach społecznościowych niż w tygodniach poprzedzających. Wśród internautów komentujących ŚDM dominował język polski oraz hiszpański i angielski, a Kraków, Warszawa i Paryż należały do najaktywniejszych miast w internecie podczas samego wydarzenia. Ciekawostką jest, że w języku polskim pisały również osoby przebywające w Wielkiej Brytanii, Niemczech i Francji.
Analiza wydźwięku zastosowana przez IBM bazuje na zaawansowanych algorytmach eksploracji danych oraz technologiach przetwarzania języka naturalnego. Umożliwia analizę dużych ilości informacji w mediach społecznościowych.
- Analizy wydźwięku pozwalają szybko przebadać pojawiające się informacje, a także lepiej zrozumieć, o czym mówią internauci. To ważne z punktu widzenia organizacji i firm, ponieważ dziś aż 8. proc. takich danych jest niewidocznych dla tradycyjnych systemów IT, a tym samym niewykorzystanych - mówi Sławomir Kumkaz IBM. - Podobne analizy można przeprowadzić w badaniach opinii i oczekiwań konsumentów, by lepiej dostosować skierowane do nich produkty czy usługi – dodaje.
By przeanalizować informacje na temat Światowych Dni Młodzieży (World Youth Days), zostały wykorzystane dane publicznie dostępne na Twitterze i Facebooku. Posty były agregowane za pomocą udostępnionych przez serwisy społecznościowe publicznych API. Do wyszukiwania i pobierania danych została wykorzystana aplikacja node.js, stworzona z użyciem platformy IBM Cloud. Wykorzystano też między innymi oprogramowanie Jupyter Notebook (język Python z biblioteką Plotly do wizualizacji), Apache Spark oraz SPSS Modeler z modułem Text Analytics.
słk
WP / IBM