Nowy program AlphaZero, opracowany przez Google i zbudowany w oparciu o technologie sieci neuronowych i sztucznej inteligencji, spotkał się w meczu z jednym z najsilniejszych silników szachowych - Stockfish 8.
Mecz składał się ze 100 partii, wynik: 64-36 (28 zwycięstw, 72 remisy) na korzyść AlphaZero.
Zdjęcie: H. Śledziewska
GM Jaan Ehlvest zamieścił na swojej stronie http://www.chessgymnasium.com/ poniższy artykuł:
Czego możemy się nauczyć od AlphaZero?
Jako trener niektórych czołowych graczy studiuję szachowe partie grane przez komputery regularnie i niektóre sam generuję. Są pewne rzeczy, których możesz nauczyć się od szachów komputerowych i wierzę, że partie z ostatniego meczu między AlphaZero i Stockfish nie są wyjątkiem. Nic nadzwyczajnego. Dla szachowej publiczności nie ma znaczenia, który program jest silniejszy, ponieważ prawie wszystkie są silniejsze niż człowiek.
Chciałbym porozmawiać o zamieszaniu wokół samego AlphaZero. Niektóre osoby, nawet szachiści, chwalą to jako coś, czego nigdy wcześniej nie widzieli, a twórcy AlphaZero chcą nam przekazać, że stworzyli coś, co może nauczyć się gry w szachy w ciągu czterech godzin i używając jakiejś zapomnianej nowej technologii zwanej sieciami neuronowymi dokonują ogromnego skoku w rozwoju programu Al (artificial intelligence). Rozwój sztucznej inteligencji za pomocą szachów jest mylący, dlatego chciałbym opisać to w kolejnych akapitach tego artykułu.
Dawno temu sugerowano, że szachy są drosophilą Al. Specyficzne znaczenie analogii nigdy nie było bardziej niż powierzchownie operacowane. To, co większość praktyków zdaje się rozumieć przez uznawanie szachów za drosophilę sztucznej inteligencji, jest po prostu tym, że szachy komputerowe, podobnie jak drosophila, reprezentują stosunkowo prosty system, który jednak może być wykorzystany do zbadania większych, bardziej złożonych zjawisk.
Program Deep Blue, który w 1997 roku pokonał Kasparowa, był w stanie ocenić 200 milionów pozycji na sekundę (co przekłada się na średnią głębokość wyszukiwania od sześciu do ośmiu posunięć). IBM wydał miliony dolarów na Deep Blue, maszynę, która rozegrała tylko sześć partii z jednym przeciwnikiem. W rzeczywistości, maszyna została zdemontowana natychmiast po swoim nikłym zwycięstwie nad Garrym Kasparowem, a jej wewnętrzne działania nigdy nie zostały ujawnione, żeby usatysfakcjonować badawczą społeczność - ważna, ale niezamierzona konsekwencja, być może, konkurencyjnego systemu turniejowego i rosnącej zależności od nagród pieniężnych dla finansowania rozwoju systemu. W każdym razie, dla wielu obserwatorów, brutalne podejście Deep Blue do szachów komputerowych - wraz z wąsko wyspecjalizowanymi technikami "Zabójca Kasparowa" - było zbyt jednostronne, by sugerować jakąkolwiek sensowną ogólną inteligencję.
"Mój Boże, kiedyś myślałem, że szachy wymagają myślenia", rozważał znany naukowiec kognitywny Douglas Hofstadter w odpowiedzi na zwycięstwo Deep Blue: "Teraz zdaję sobie sprawę, że tak nie jest. Nie znaczy to, że Kasparow nie jest głębokim myślicielem, tylko że można pominąć głębokie myślenie w grze w szachy, sposób fruwania bez trzepotania skrzydłami" (cyt. za: Weber, 1996). W odpowiedzi na zwycięstwo Deep Blue opublikowanej w 1997 roku w czasopiśmie Science, John McCarty, założyciel sztucznej inteligencji i turniejów programów szachowych, publicznie ubolewał nad stopniem, w jakim szachy komputerowe były zaślepione zwycięstwami turniejowymi: "szachy rozwijają się tak bardzo, jak rozwijałaby się genetyka, gdyby genetycy skoncentrowali swoje wysiłki, począwszy od 1910 roku, na hodowli Drosophila. Mielibyśmy trochę nauki, ale głównie mielibyśmy bardzo szybkie muszki owocowe."
W sercu krytyki McCarthy'ego jest przekonanie, że chociaż szachy komputerowe były produktywne w tym, że zachęcały do ciągłych eksperymentów, nie przyniosły one żadnych nowych teorii - ani o ludzkich procesach poznawczych, ani o teoretycznej informatyce.
Herbert Simon i Allen Newell podkreślili, że istotne jest nie tylko to, że komputer wykonał dobre ruchy, ale że wykonał je z właściwych powodów. Szachy komputerowe były dla Simona i Newella cenne tylko do tego stopnia, że stanowiły "celową próbę symulowania ludzkich procesów myślowych" (Newell i in., 1958). Ten wzniosły cel został wkrótce porzucony w dążeniu do budowy silniejszych zawodników turniejowych.
Wyścig budowy zwycięskiego progamu gry w szachy jako jedynego udanego wyniku rozwoju AI tylko sprawił, że różnica między człowiekiem a maszyną jest szersza.
Brutalno-siłowe podejście do szachów komputerowych uwypukliło rosnący podział na sztuczną inteligencję i ludzkie nauki kognitywne. Coraz więcej badań nad ludzkimi szachistami wskazywało, że ludzie rzadko myślą o więcej niż jednym lub dwóch ruchach, opierając się na percepcji, rozpoznawaniu wzorców i korzystaniu z heurystyki. Szachy, grane przez ludzi, okazały się jeszcze bardziej złożoną działalnością poznawczą, niż wyobrażali to sobie pierwsi badacze sztucznej inteligencji (Wagner i Scurrah, 1971). W rezultacie szachy komputerowe zaczęły być postrzegane jako coraz bardziej odmienne od ludzkich szachów.
Wydaje się, że wielu badaczy AI wierzyło, że podstawową miarą eksperymentalnego organizmu była jego zdolność do tworzenia fundamentalnej teorii, wówczas szachy prawdopodobnie nie były drosophilą sztucznej inteligencji. Pomimo imponującej produktywności badaczy szachów komputerowych, program badań, do którego zachęcały szachy komputerowe, był po prostu zbyt wąski, aby mógł być zrównoważony. To było tak, jakby badania genetyczne oparte na drosophilii nigdy nie wykroczyły poza oznakowaniem chromosomu drosophila.
Mapowanie chromosomów było oczywiście ważnym wkładem drosophilistów w badania genetyczne, ale ponieważ techniki mapowania stawały się coraz bardziej rutynowe, zainteresowanie drosophila było w stagnacji. Dopiero po wprowadzeniu do laboratorium nowych dzikich odmian drosophila i odejściem od nich drosophilistów ponownie zastosowano drosophilę jako eksperymentalną technologię badania genetyki populacyjnej. Komputerowe szachy jeszcze nie miały takiego drugiego aktu.
Dopiero wraz z wprowadzeniem do laboratorium nowych dzikich odmian drosophila i przeniesieniem z niego drosophilistów, drosophila została odkryta jako eksperymentalna technologia do badania genetyki populacyjnej. Komputerowe szachy nie miały jeszcze takiego drugiego aktu. AlphaZero ma mieć taką, gdyż korporacja Google chce, żebyśmy w to wierzyli.
Patrząc na partie AlphaZero znalazłem jedną pozycję, która ma trochę obecności Al. Partia jest komentowana poniżej, a posunięcie, o którym mówię, to 19. posunięcie białych h2-h3 Najprawdopodobniej się mylę, a posunięcie wciąż wychodzi z brutalnej siły drzewa obliczeniowego i nie ma nic wspólnego z sztuczną inteligencją. Myślę, że porównanie z psychologią zwierząt jest tutaj bardzo istotne. Mamy bardzo duże dane na temat zachowania zwierząt i pomimo powszechnych wierzeń zarejestrowano bardzo niewiele przypadków, kiedy zwierzęta celowo starają się przesyłać sygnały lub informacje ludziom za pomocą ich umysłu. Zwierzęta są związane z ich instynktami, a wykrycie pojawienia się życia intelektualnego jest rzadkością, tak jak pojawienie się AI w w grającym w szachy programie komputerowym.
Mam nadzieję, że tym razem AlphaZero nie zniknie jak Deep Blue i więcej informacji będzie dostępnych dla publiczności. Musimy poczekać.
Jaan Ehlvest, 11 grudnia 2017