Logopedia i AI. Za odkryciem polskiego naukowca kryje się wzruszająca historia
Polski naukowiec stworzył urządzenie wspomagane przez sztuczną inteligencję, które będzie wsparciem dla logopedów. System pomoże w identyfikacji przedszkolaków, które wymagają terapii mowy i zidentyfikuję genezę problemu. "Sztuczną inteligencję trzeba odpowiednio nakarmić danymi, by wiedziała, co wskazywać logopedom. Algorytmy muszą być trenowane na dużych zbiorach danych, by rozpoznawać subtelne różnice w wymowie czy ruchach twarzy podczas artykulacji. To właśnie logopedzi dostarczają wiedzę, która pozwala nauczyć system, jak wspierać terapię" – wyjaśnia naukowiec.
Jak podaje PAP, dzięki połączeniu z aplikacją, narzędzie to ułatwi proces diagnozy, dostarczy rodzicom niezbędnych wskazówek i umożliwi zdalne konsultacje między specjalistami, takimi jak logopedzi, ortodonci czy fizjoterapeuci. Wyposażone w urządzenie dzieci będą wymawiać słowa i zdania, a aplikacja wskaże, czy widać lub słychać nieprawidłowości.
Młodym naukowcem kierowały osobiste doświadczenia
Osobiste doświadczenia młodego naukowca przyczyniły się do stworzenia zespołu zajmującego się opracowaniem urządzenia i oprogramowania do rejestracji oraz analizy dźwięku i obrazu w kontekście logopedycznym. Michał Kręcichwost, który obecnie pełni funkcję kierownika programu LIDER NCBR, wówczas student inżynierii biomedycznej na Politechnice Śląskiej w Gliwicach, zmotywowany był mamy. Kobieta przeszła udar mózgu, wyniku, którego doznała afazji, czyli utraty zdolności mowy.
Dla naszej rodziny było to zupełnie nowe i trudne doświadczenie. Nie wiedzieliśmy, czym jest afazja i jak zacząć rehabilitację
Dalsza część artykułu pod materiałem wideo
Bliskość i bezpieczeństwo - czas epokowych zmian? - Historie Jutra napędza PLAY #6
Dr inż. Michał Kręcichwost podjął decyzję o wsparciu najpierw dorosłych pacjentów cierpiących na afazję, a następnie dzieci, które potrzebują pomocy w rozwijaniu umiejętności mowy. Aktualnie jego zespół integruje różne technologie, aby stworzyć system SpeechCAD, mający na celu wspieranie logopedów w całej Polsce.
Darmowa aplikacja dla ludzi mierzących się z afazją
W przeszłości, wspólnie z inżynierami Zuzanną Miodońską i Krzysztofem Mrozowskim, opracował aplikację internetową "Afast! Powiedz to", która wspiera rehabilitację osób z afazją. Jak tłumaczy naukowiec, aplikacja pełni rolę wirtualnego terapeuty, wypełniając czas pomiędzy wizytami u specjalisty. Platforma jest dostępna bezpłatnie i oferuje różnorodne ćwiczenia logopedyczne. Autorzy projektu, realizowanego w ramach programu Innowacje Społeczne, uważają, że odniósł on sukces, a aplikacja nadal wspiera osoby z problemami mowy.
Badania z udziałem starszych osób z afazją okazały się jednak wymagającym zadaniem — każda z nich zmaga się z nieco innymi problemami związanymi nie tylko z artykulacją, ale i z rozumieniem. Zebranie odpowiedniej bazy danych niezbędnej do opracowania algorytmów było sporym wyzwaniem. Dlatego w dalszych badaniach skupiliśmy się na dzieciach w wieku przedszkolnym, do których dostęp był łatwiejszy
Jak to działa?
W trakcie pracy nad doktoratem naukowiec skonstruował urządzenie do rejestrowania przestrzennego sygnału akustycznego, które zbiera dźwięki mowy z wielu mikrofonów, oraz opracował model głęboki do identyfikacji niepoprawnej wymowy głoski "sz". Równocześnie dr inż. Miodońska, korzystając z danych zebranych przez to urządzenie, stworzyła metody klasyfikujące różne realizacje głosek "sz". Dzięki ich metodom można określić, które dźwięki dziecko wymawia prawidłowo, a które wymagają poprawy.
Zainicjowano prace nad obiektywną oceną ruchów aparatu mowy. W ramach programu LIDER naukowcy opracowują urządzenie, które nazwali "narzędziem 4D". To innowacyjne rozwiązanie rejestruje nie tylko dźwięk, ale również obraz twarzy oraz zmiany zachodzące w czasie, tworząc trójwymiarowy model osoby mówiącej.
Dane będą przetwarzane przez zaawansowaną formę sztucznej inteligencji. System będzie analizować ruchy artykulatorów i wymowę, a wyniki będą prezentowane w aplikacji w postaci modelu 3D mówcy w czasie. Dzięki temu logopeda będzie mógł pokazać rodzicom postępy terapii – to, jak zmienia się wymowa dziecka. Taki model będzie również wykorzystywany do współdzielenia z różnymi specjalistami w celu pogłębienia diagnozy. Wówczas logopeda będzie mógł zapis danych w postaci modelu 4D po prostu przesyłać innym specjalistom, np. ortodoncie