SI DeepMind robi kolejny duży krok. Będzie uczyć się podobnie do dzieci

Sztuczna inteligencja opracowana przez DeepMind zyskała rozgłos, pokonując mistrza Go. Teraz, nowo opracowany system pozwoli jej uczyć się podobnie, jak robią to dzieci - metodą prób i błędów.

Sztuczna InteligencjaSztuczna Inteligencja
Źródło zdjęć: © Pexels

O DeepMind było ostatnio głośno, ponieważ sztuczna inteligencja pomogła na polu nauk biologicznych, co doprowadziło do przełomu w badaniach trwających ponad 50 lat. Teraz firma opracowała nowy system MuZero, który może zrewolucjonizować sposób rozwijania się sztucznej inteligencji. 

System MuZero pozwala sztucznej inteligencji uczyć się zasad gier na podstawie metody prób i błędów, podobnie, jak robią to dzieci. Algorytm nie otrzymuje więc żadnych wstępnych informacji, a naukę reguł rozpoczyna od spróbowania jakiegoś działania. Następnie sprawdza, czy działanie było dozwolone i skuteczne. 

Spośród podejmowanych akcji, będzie wybierać te, które przyniosą najlepsze rezultaty. W praktyce oznacza to, że w szachach będzie dążyć do szach-mat, a w Pac-Manie do połknięcia wszystkich kropek. Następnie będzie w stanie oszacować, jak dojść do pożądanego rezultatu najkrótszą drogą. 

Ten sposób nauki może okazać się przełomowy dla sztucznych inteligencji. Będzie umożliwiał jej naukę rozwiązywania problemów, na które się natknie, dzięki czemu w bardziej efektowny sposób będzie w stanie rozwiązywać problemy również z poważniejszych dziedzin niż gry. 

- Obecnie MuZero uczy się kompresji wideo. W przypadku AlphaZero nauczenie się tego zadania byłoby bardzo kosztowne - wyjaśnili autorzy algorytmu. Następnym krokiem może być nauczenie sztucznej inteligencji jazdy samochodem. Ale MuZero może znaleźć też zastosowanie w naukach biologicznych, podobnie jak jej siostrzana AlphaFold, ale z lepszymi i szybszymi rezultatami. 

Zobacz: Dzięki nim studenci medycyny nie muszą przekopywać cmentarzy. Drukują ludzkie czaszki w 3D [Wideo]

DeepMind podkreśla, że nowy sposób uczenia się sztucznej inteligencji jest bardziej ekonomiczny, a algorytm radzi sobie ze stawianymi problemami zaskakująco dobrze. Chociaż sam proces nauki wymaga ogromnych zasobów obliczeniowych, to po poznaniu zasad, SI wymaga tak niewielu obliczeń, że mogłaby działać na smartfonie. 

- Jednak nawet nauka nie jest bardzo wymagająca. MuZero nauczył się od podstaw zasad Pac-Mana w ciągu 2-3 tygodni, korzystając przy tym z jednego GPU, mówi Julian Schrittwieser, jeden ze współautorów algorytmu. Wszystko dlatego, że algorytm bierze pod uwagę tylko istotne elementy w procesie decyzji. - Wiedza, że parasol ochroni cię przed deszczem, jest bardziej użyteczna, niż umiejętność modelowania ruchu kropel wody w powietrzu - dodają twórcy.

Twórcy MuZero chcą, by ich algorytm był w stanie samodzielnie i szybko decydować, które informacje faktycznie są mu potrzebne do podjęcia odpowiedniej decyzji. Przyrównują swoją SI do dziecka, które już po kilkukrotnym doświadczaniu jakiegoś zjawiska, jest w stanie połączyć ze sobą fakty. Tak, jak w przykładzie z parasolem. 

Wybierz najlepsze sprzęty technologiczne tego roku i wygraj 5 tys. złotych! Wejdź na imperatory.wp.pl i zagłosuj

Wybrane dla Ciebie
Umowa z Płomieniem Zachodu i Kamieniami Widzenia. Co oferują Polsce Anduril i Palantir?
Umowa z Płomieniem Zachodu i Kamieniami Widzenia. Co oferują Polsce Anduril i Palantir?
Graniczą z Ukrainą. Część żołnierzy z USA opuszcza kraj NATO
Graniczą z Ukrainą. Część żołnierzy z USA opuszcza kraj NATO
Dwutlenek węgla szkodzi także w jonosferze. Nieoczywiste zagrożenia
Dwutlenek węgla szkodzi także w jonosferze. Nieoczywiste zagrożenia
Badacze szukają odpowiedzi. Świadomość jest nadal dla nas tajemnicą
Badacze szukają odpowiedzi. Świadomość jest nadal dla nas tajemnicą
„Cegiełki życia” poza Drogą Mleczną. Pierwsze takie odkrycie
„Cegiełki życia” poza Drogą Mleczną. Pierwsze takie odkrycie
Tym chcą zwalczać drony. USA zamówiły broń w Szwecji
Tym chcą zwalczać drony. USA zamówiły broń w Szwecji
Nowa fabryka w Polsce. Będą produkować więcej amunicji 155 mm
Nowa fabryka w Polsce. Będą produkować więcej amunicji 155 mm
Zbliża się eksplozja V Sagittae. To fascynujący układ dwóch gwiazd
Zbliża się eksplozja V Sagittae. To fascynujący układ dwóch gwiazd
Niepokojące zjawisko. Właśnie to dzieje się z Grenlandią
Niepokojące zjawisko. Właśnie to dzieje się z Grenlandią
Demon prędkości. Wzbił się w powietrze po raz pierwszy
Demon prędkości. Wzbił się w powietrze po raz pierwszy
Sprawi, że nauczysz się mniej. AI nie jest idealnym narzędziem
Sprawi, że nauczysz się mniej. AI nie jest idealnym narzędziem
Niszczy roje dronów laserem. Broń będzie gotowa za cztery lata
Niszczy roje dronów laserem. Broń będzie gotowa za cztery lata