SI DeepMind robi kolejny duży krok. Będzie uczyć się podobnie do dzieci

SI DeepMind robi kolejny duży krok. Będzie uczyć się podobnie do dzieci29.12.2020 11:42
Sztuczna Inteligencja
Źródło zdjęć: © Pexels

Sztuczna inteligencja opracowana przez DeepMind zyskała rozgłos, pokonując mistrza Go. Teraz, nowo opracowany system pozwoli jej uczyć się podobnie, jak robią to dzieci - metodą prób i błędów.

O DeepMind było ostatnio głośno, ponieważ sztuczna inteligencja pomogła na polu nauk biologicznych, co doprowadziło do przełomu w badaniach trwających ponad 50 lat. Teraz firma opracowała nowy system MuZero, który może zrewolucjonizować sposób rozwijania się sztucznej inteligencji. 

System MuZero pozwala sztucznej inteligencji uczyć się zasad gier na podstawie metody prób i błędów, podobnie, jak robią to dzieci. Algorytm nie otrzymuje więc żadnych wstępnych informacji, a naukę reguł rozpoczyna od spróbowania jakiegoś działania. Następnie sprawdza, czy działanie było dozwolone i skuteczne. 

Spośród podejmowanych akcji, będzie wybierać te, które przyniosą najlepsze rezultaty. W praktyce oznacza to, że w szachach będzie dążyć do szach-mat, a w Pac-Manie do połknięcia wszystkich kropek. Następnie będzie w stanie oszacować, jak dojść do pożądanego rezultatu najkrótszą drogą. 

Ten sposób nauki może okazać się przełomowy dla sztucznych inteligencji. Będzie umożliwiał jej naukę rozwiązywania problemów, na które się natknie, dzięki czemu w bardziej efektowny sposób będzie w stanie rozwiązywać problemy również z poważniejszych dziedzin niż gry. 

- Obecnie MuZero uczy się kompresji wideo. W przypadku AlphaZero nauczenie się tego zadania byłoby bardzo kosztowne - wyjaśnili autorzy algorytmu. Następnym krokiem może być nauczenie sztucznej inteligencji jazdy samochodem. Ale MuZero może znaleźć też zastosowanie w naukach biologicznych, podobnie jak jej siostrzana AlphaFold, ale z lepszymi i szybszymi rezultatami. 

Zobacz: Dzięki nim studenci medycyny nie muszą przekopywać cmentarzy. Drukują ludzkie czaszki w 3D [Wideo]

DeepMind podkreśla, że nowy sposób uczenia się sztucznej inteligencji jest bardziej ekonomiczny, a algorytm radzi sobie ze stawianymi problemami zaskakująco dobrze. Chociaż sam proces nauki wymaga ogromnych zasobów obliczeniowych, to po poznaniu zasad, SI wymaga tak niewielu obliczeń, że mogłaby działać na smartfonie. 

- Jednak nawet nauka nie jest bardzo wymagająca. MuZero nauczył się od podstaw zasad Pac-Mana w ciągu 2-3 tygodni, korzystając przy tym z jednego GPU, mówi Julian Schrittwieser, jeden ze współautorów algorytmu. Wszystko dlatego, że algorytm bierze pod uwagę tylko istotne elementy w procesie decyzji. - Wiedza, że parasol ochroni cię przed deszczem, jest bardziej użyteczna, niż umiejętność modelowania ruchu kropel wody w powietrzu - dodają twórcy.

Twórcy MuZero chcą, by ich algorytm był w stanie samodzielnie i szybko decydować, które informacje faktycznie są mu potrzebne do podjęcia odpowiedniej decyzji. Przyrównują swoją SI do dziecka, które już po kilkukrotnym doświadczaniu jakiegoś zjawiska, jest w stanie połączyć ze sobą fakty. Tak, jak w przykładzie z parasolem. 

Wybierz najlepsze sprzęty technologiczne tego roku i wygraj 5 tys. złotych! Wejdź na imperatory.wp.pl i zagłosuj

Szanowna Użytkowniczko! Szanowny Użytkowniku!
×
Aby dalej móc dostarczać coraz lepsze materiały redakcyjne i udostępniać coraz lepsze usługi, potrzebujemy zgody na dopasowanie treści marketingowych do Twojego zachowania. Twoje dane są u nas bezpieczne, a zgodę możesz wycofać w każdej chwili na podstronie polityka prywatności.

Kliknij "PRZECHODZĘ DO SERWISU" lub na symbol "X" w górnym rogu tej planszy, jeżeli zgadzasz się na przetwarzanie przez Wirtualną Polskę i naszych Zaufanych Partnerów Twoich danych osobowych, zbieranych w ramach korzystania przez Ciebie z usług, portali i serwisów internetowych Wirtualnej Polski (w tym danych zapisywanych w plikach cookies) w celach marketingowych realizowanych na zlecenie naszych Zaufanych Partnerów. Jeśli nie zgadzasz się na przetwarzanie Twoich danych osobowych skorzystaj z ustawień w polityce prywatności. Zgoda jest dobrowolna i możesz ją w dowolnym momencie wycofać zmieniając ustawienia w polityce prywatności (w której znajdziesz odpowiedzi na wszystkie pytania związane z przetwarzaniem Twoich danych osobowych).

Od 25 maja 2018 roku obowiązuje Rozporządzenie Parlamentu Europejskiego i Rady (UE) 2016/679 (określane jako "RODO"). W związku z tym chcielibyśmy poinformować o przetwarzaniu Twoich danych oraz zasadach, na jakich odbywa się to po dniu 25 maja 2018 roku.

Kto będzie administratorem Twoich danych?

Administratorami Twoich danych będzie Wirtualna Polska Media Spółka Akcyjna z siedzibą w Warszawie, oraz pozostałe spółki z grupy Wirtualna Polska, jak również nasi Zaufani Partnerzy, z którymi stale współpracujemy. Szczegółowe informacje dotyczące administratorów znajdują się w polityce prywatności.

O jakich danych mówimy?

Chodzi o dane osobowe, które są zbierane w ramach korzystania przez Ciebie z naszych usług, portali i serwisów internetowych udostępnianych przez Wirtualną Polskę, w tym zapisywanych w plikach cookies, które są instalowane na naszych stronach przez Wirtualną Polskę oraz naszych Zaufanych Partnerów.

Dlaczego chcemy przetwarzać Twoje dane?

Przetwarzamy je dostarczać coraz lepsze materiały redakcyjne, dopasować ich tematykę do Twoich zainteresowań, tworzyć portale i serwisy internetowe, z których będziesz korzystać z przyjemnością, zapewniać większe bezpieczeństwo usług, udoskonalać nasze usługi i maksymalnie dopasować je do Twoich zainteresowań, pokazywać reklamy dopasowane do Twoich potrzeb. Szczegółowe informacje dotyczące celów przetwarzania Twoich danych znajdują się w polityce prywatności.

Komu możemy przekazać dane?

Twoje dane możemy przekazywać podmiotom przetwarzającym je na nasze zlecenie oraz podmiotom uprawnionym do uzyskania danych na podstawie obowiązującego prawa – oczywiście tylko, gdy wystąpią z żądaniem w oparciu o stosowną podstawę prawną.

Jakie masz prawa w stosunku do Twoich danych?

Masz prawo żądania dostępu, sprostowania, usunięcia lub ograniczenia przetwarzania danych. Możesz wycofać zgodę na przetwarzanie, zgłosić sprzeciw oraz skorzystać z innych praw wymienionych szczegółowo w polityce prywatności.

Jakie są podstawy prawne przetwarzania Twoich danych?

Podstawą prawną przetwarzania Twoich danych w celu świadczenia usług jest niezbędność do wykonania umów o ich świadczenie (tymi umowami są zazwyczaj regulaminy). Podstawą prawną przetwarzania danych w celu pomiarów statystycznych i marketingu własnego administratorów jest tzw. uzasadniony interes administratora. Przetwarzanie Twoich danych w celach marketingowych realizowanych przez Wirtualną Polskę na zlecenie Zaufanych Partnerów i bezpośrednio przez Zaufanych Partnerów będzie odbywać się na podstawie Twojej dobrowolnej zgody.