Polscy naukowcy mają sposób na fałszywe informacje. Algorytm rozpozna styl fake newsa

Nie tylko treść, ale sposób, w jaki fałszywa wiadomość została napisana - zdaniem polskich naukowców jest to równie ważne, gdy chce się rozpoznać fake newsa. Dlatego ich algorytm skupi się właśnie na stylu.

Bardzo często rosyjscy manipulatorzy sieją nieprawdę
Bardzo często rosyjscy manipulatorzy sieją nieprawdę
Adam Bednarek

Fake newsy to olbrzymi współczesny problem. Nabierają się nie tylko zwykli użytkownicy internetu, ale też osoby, które teoretycznie powinny być świadome zagrożenia: dziennikarze, politycy czy celebryci. Niby Facebook i inni technologiczni giganci próbują walczyć ze zjawiskiem, ale wychodzi im do jak do tej pory średnio.

Kluczem do popularności fałszywej informacji jest oczywiście zaskakująca, często wręcz absurdalna treść. Ale polscy naukowcy zwracają uwagę na inną istotną cechę. 

- Chcemy sprawdzić, jaka będzie wydajność oceny wiarygodności dokumentu na podstawie cech czysto stylistycznych - mówi PAP dr inż. Piotr Przybyła z Instytutu Podstaw Informatyki PAN. 

Jego zespół buduje algorytm, który zajmie się właśnie taką analizą. 

Polskim naukowcom chodzi o to, aby algorytm wykrywał nie tylko nieprawdę, ale rozumiał również techniki stosowane przez boty albo manipulatorów. 

Jak do tej pory algorytm pracował na bazie składającej się z ok. 100 tys. anglojęzycznych tekstów. Polscy naukowcy otrzymali je m.in. od organizacji zajmujących się weryfikacją faktów. 

Algorytm wie, jakie cechy charakteryzują tekst prawdziwy i jakie nieprawdziwy. Naukowcy ustalili, że te pierwsze wyróżniają się dużą liczbą źródeł i danych. Z kolei fake newsy bazują na emocjach czy osądach moralnych. W sumie takich cech jest przeszło 900.  

- Nasz model uczenia maszynowego w pewnym sensie uczy się sam - podajemy mu dane wejściowe z określonym etykietowaniem oraz cechy, które opisują te dane. Następnie do algorytmu należy podjęcie decyzji dotyczącej powiązania cech z wiarygodnością - tłumaczy PAP dr inż. Piotr Przybyła. 

Obecnie skuteczność algorytmu wynosi 80-90 proc., ale dla polskich naukowców to jeszcze za mało. Później technologia będzie testowana na prawdziwych użytkownikach internetu. 

Wybrane dla Ciebie
Komentarze (219)