Moment istoric în domeniul IA: AlphaGo Zero a învăţat singur şi a devenit cel mai bun jucător de Go din lume

0
Publicat:
Ultima actualizare:
AlphaGo a învins campionul uma la Go cu scorul de 4-1/ Foto: EPA
AlphaGo a învins campionul uma la Go cu scorul de 4-1/ Foto: EPA

DeepMind, dezvoltat de cei de la Google, a devenit cel mai bun jucător de Go din lume, un joc de strategie extrem de complex, fără niciun input din partea experţilor umani.

DeepMind, subsidiara din Londra a unităţii pentru Inteligenţă Artificială a celor de la Google, a anunţat acestă ultimă descoperire din domeniul IA la mai puţin de doi ani de zile după dezvoltarea algoritmului AlphaGo, primul calculator ce a învins campionul uman al acestui vechi joc, originar din Asia. Detaliile acestei ultime descoperiri au fost publicate în revista Nature.

Versiunile anterioare ale AlphaGo învăţau să joace acest joc prin analizarea a mii de jocuri dintre jucătorii de top umani pentru a descoperi mutările câştigătoare. În noua etapă, algoritmul AlphaGo Zero a renunţat la expertiza umană şi a început să înveţe acest joc cunoscând doar regulile şi obiectivul jocului.

„Învaţă să joace jucând sigur, pornind de la situaţii complet aleatorii”, a afirmat Demis Hassabis, directorul executiv al DeepMind. „În acest mod, a depăşit imediat nivelul uman de joc şi a învins versiunea anterioară AlphaGo cu scorul de 100 la 0. Totul în doar 72 de ore”.

David Silver, liderul proiectului AlphaGo, a adăugat că „prin ne-utilizarea cunoştinţelor umane în niciun fel, poate ajunge la informaţii noi, la cunoaştere de unul singur, pornind de la zero informaţii”. În doar câteva zile, computerul nu doar că a învăţat Go de la zero, dar a depăşit mii de ani de strategie şi înţelepciune umană acumulate.

Echipa de cercetători a dezvoltat un nou mecanism de învăţare pentru AlphaGo Zero, ce combină analiza simulărilor mutărilor viitoare cu o reţea neurală care decide care mutări îi oferă cea mai ridicată probabilitate de a câştiga. Reţeaua este updatată în mod constant după milioane de jocuri de antrenament, ce produce astfel un sistem superior după fiecare joc.

Dacă lui AlphaGo i-au trebuit luni întregi pentru a ajunge la punctul de a învinge campionul uman la Go, lui AlphaGo Zero i-au fost suficiente doar trei zile, utilizând doar o mică parte a puterii de procesare. „Acest lucru arată că ceea ce contează sunt algoritmii, şi nu puterea de procesare sau baza de date”, a subliniat David Silver.

Cu toate că jocul Go este extrem de complex, existând mai multe mutări posibile decât atomi în întregul Univers, într-un alt sens este un joc simplu pentru că este un joc cu informaţie perfectă - şansa nu joacă niciun rol, precum în jocurile de cărţi sau cu zaruri, iar strategia de joc este determinată doar de poziţia pieselor pe planşa de joc. Jocul presupune înconjurarea unui teritoriu superior decât al oponentului.

Aceste aspecte ale jocului îl fac ideal pentru simulările la care excelează AlphaGo Zero. Însă, echipa din jurul DeepMind analizează acum probleme reale ce pot fi structurate similar şi unde aplicarea acestei tehnologii noi poate oferi soluţii inovatoare.

Demis Hassabis a identificat anticiparea structurii moleculelor de proteină - un aspect important în descoperirea de medicamente noi - drept un astfel de domeniu. Alte arii de aplicabilitatea a acestei tehnologii pot fi dezvoltarea de noi materiale şi modele climatice.

„Sper ca acest fel de algoritmi vor „lucra” în mod obişnuit alături de oamenii de ştiinţă, acesta este modul în care ştiinţa va continua să avanseze în viitor”, a afirmat Demis Hassabis.

Știință



Partenerii noștri

image
canal33.ro
Ultimele știri
Cele mai citite