Ana sayfa 147. Sayı 4-1 biten AlphaGo – Lee Sedol karşılaşması: Ve yapay zekâ insanı Go’da da...

4-1 biten AlphaGo – Lee Sedol karşılaşması: Ve yapay zekâ insanı Go’da da yendi!

236
PAYLAŞ

Bilindiği gibi Koreli dünya şampiyonu Lee Sedol ve Google DeepMind şirketinin geliştirdiği AlphaGo arasındaki maçlar, AlphaGo’nun 4-1’lik üstünlüğüyle sona ermişti. Go oyununda olasılık sayısının fazla olması, satranca göre tahtasının büyüklüğü ve hangi şeklin daha iyi olacağına dair “sezgisel” bir karar mekanizmasına ihtiyaç duyulması gibi nedenlerden dolayı, satrançta olduğu gibi dünya şampiyonunu yenecek bir program geliştirmek uzun yıllardır mümkün olmamıştı. Bu yazıda, bu tarihi serinin haber yönüne ve serideki oyunlarda rastlanan ilginç hamlelere değinilecek.

Koreli dünya şampiyonu Lee Sedol ve Google DeepMind şirketinin geliştirdiği AlphaGo arasındaki maçlar, AlphaGo’nun 4-1’lik üstünlüğüyle sona erdi. Her maç terkle sona erdi.(1) Maçlardan sonra Kore Go Federasyonu AlphaGo’ya fahri 9 dan unvanı verdi.(2) Bu serinin sonucunda, go oyunu tarihinde ilk defa, bir bilgisayar programı dünya şampiyonu bir oyuncuyu yenmiş oldu. Bu seri, tarihsel açıdan 1997’de satranç şampiyonu Kasparov ile IBM’in geliştirdiği Deep Blue adlı program arasında yapılan seriyle aynı öneme sahiptir. Diğer yandan go oyununda olasılık sayısının fazla olması, satranca göre tahtanın büyük olması, hangi şeklin daha iyi olacağına dair “sezgisel” bir karar mekanizmasına ihtiyaç duyulması gibi nedenlerden dolayı, satrançta olduğu gibi dünya şampiyonunu yenecek bir program geliştirmek uzun yıllardır mümkün olmamıştı. Ancak Google ve ekibinin, Monte Carlo algoritmasıyla yapay sinir ağını birleştirerek yarattığı AlphaGo, sonunda bunu başarmış gözüküyor. Bu açıdan Lee Sedol-AlphaGo serisi, yalnızca go severler için önem taşımanın dışında, yapay zekâ konusunda da bir kilometre taşı değerini taşıyor. Bilim ve Gelecek’in Mart 2016 sayısında AlphaGo ve mekanizmasıyla ilgili teknik detaylara değinilmiş olduğundan, bu yazıda, bu tarihi serinin biraz haber yönüne ve serideki oyunlarda rastlanan ilginç hamlelere değinilecek.

Sözü edilesi hamleler

Beş maçın her birinde de daha önce profesyonel maçlarda eşine pek rastlanmayan, hatta profesyonel oyuncuların önce hata olarak nitelediği, ama bir şekilde AlphaGo’nun lehine sonuçlanan hamleler yapıldı. Bu durumun olası bir nedeni, serinin 3-0 AlphaGo lehine olduğu maçtan sonra düzenlenen basın toplantısında ortaya çıktı. Bir gazeteci, serinin Lee Sedol’ün aleyhine olduğunu, çünkü AlphaGo’ya seriden önce Lee Sedol’ün bütün maçlarının kaydedildiğini, ancak Lee Sedol’ün rakibiyle ilgili hiçbir şey bilmediğini ifade etti. AlphaGo temsilcisi Demis Hassabis ise AlphaGo’ya yalnızca bir go sunucusundaki amatör oyuncuların maçlarını kaydettiklerini, sonrasında AlphaGo’nun kendi kendine yaptığı maçlarla kendini geliştirdiğini açıkladı. Bu durum her şeyi daha da ilginçleştirdi, çünkü bu açıklamaya göre, AlphaGo’nun oyun oynayarak “öğrenen” yapay sinir ağının örüntü arama ve en iyi hamleyi bulma sürecini amatör oyuncular üzerinden yaptığı bir senteze dayandığını gösteriyor.

 

1. Maç 102. hamle

Maçlardan önce genel görüş, Lee Sedol’ün belki bir ya da iki maç kaybedeceği, ama beş maçlık seriyi kazanacağıydı. Bu nedenle ilk maçı AlphaGo’nun kazanması herkeste büyük bir şaşkınlık yarattı. İlk yorumlar, Lee Sedol’ün bu maçta rakibinin gücünü test ettiği, asıl kendi oyununu bundan sonraki maçlarda göstereceği yönünde oldu. Ancak ilk maçta yapılan bir hamle, AlphaGo’nun daha önceki Go yazılımlarına hiç de benzemediğini gösterdi. Oyun dengede giderken AlphaGo’nun rakibin alanını işgal etmeye yönelik yaptığı 102. hamle, Lee Sedol’ün ve tüm izleyicilerin ağzını açık bıraktı. Rakipten böyle agresif bir hamle beklemeyen Lee Sedol, bu hamleden sonra yaptığı birkaç küçük hatayla puan olarak geriye düştü ve oyun sonuna kadar bir daha rakibini yakalayamadı. [102. Hamle görseli 1 nolu]

 

2. Maç 57. hamle

İkinci maçta AlphaGo’nun 57. hamlesi de aynı şekilde başta profesyonel yorumcular olmak üzere, pek çok izleyiciyi şaşkına çevirdi. [57. Hamle görseli] Rakibe normal şartlarda gereğinden fazla alan yapma fırsatı veren bu hamle, maç sırasında bütün profesyonel yorumcular tarafından “fazla tuhaf” ya da basitçe “kötü hamle” olarak nitelendirildi. Bu tip seviyelerde oynanan maçlarda bu tür “kötü hamle”ler oyunun kaderini epey belirlediğinden, oyun sırasında birçok yorumcu bu oyunu Lee Sedol’ün kazanabileceğini söyledi. Ancak AlphaGo, oyunun devamında bu hamlesini beklenmedik bir taktikle kullanarak, birbirinden kopuk olan taşlarını bağlamayı başardı ve öne geçti, oyun sonunda da kusursuza yakın hesaplama becerisiyle Lee Sedol’ün kendisini yakalamasına izin vermedi. Oyunun ardından, bir amatör oyuncu, daha önce hiçbir profesyonel oyuncu kayıtlarında bulunmayan 57. hamleyi oynadığı bir oyunun kaydını yayınladı ve böylece Demis Hassabis’in basın toplantısındaki açıklaması da teyit edilmiş oldu.

Lee Sedol’ün, seride şansını devam ettirmek için kazanmak zorundu olduğu 3. maçta oldukça gergin olduğu gözüktü. Herhangi bir psikolojik durumdan etkilenmeyen rakibi ise, her zamanki oyununu oynayarak, rakibine şans vermedi. Bu maçtan sonraki basın toplantısında Lee Sedol, AlphaGo’ya karşı kazanmanın, yalnızca oyun başında ve belki de ortasında çok üstünlük kurmakla mümkün olabileceğini, çünkü puan hesaplamanın çok önemli olduğu oyunun sonlarına doğru, AlphaGo’nun kesinlikle hata yapmadığını söyledi.

Kazandığı 4. Maçta Lee Sedol’ün kritik hamlesi: 78. Hamle.

4. oyunda ise go severler, bu sefer insan tarafından yapılan olağanüstü bir hamleye tanık oldu. Lee Sedol bu oyunda, daha önceki oyunlarda kullandığı sağlamcı taktiği değiştirerek, tahtada karmaşık pozisyonlar yaratmaya çalıştı. Bunun sonucunda, aslında oldukça riskli bir taktik olan rakibin kendisini sarmasına izin veren Lee Sedol, hiçbir yorumcunun tahmin edemediği ve belki de o pozisyonda yapılması gereken tek doğru hamleyi bularak, 78. hamlede kendisini saran rakibin taşlarını delmenin bir yolunu buldu. [78. hamle görseli] Bütün yorumcular ve izleyiciler bir yana, büyük olasılıkla AlphaGo’nun bile beklemediği bir hamleydi bu; çünkü -biraz da latife yaparak- denilebilir ki AlphaGo’nun “devreleri yandı” ve sanki “paniğe kapılarak” ancak düşük seviyeli amatör oyunculardan beklenebilecek basit hesaplama hataları yaptı, birkaç hamle sonra da pes ettiğini ilan etti. Lee Sedol’ün bu hamlesi büyük sansasyon yarattı ve belki de insanın tek galibiyetinin sembolü olarak, oyundan hemen sonra pozisyonun görselini içeren tişörtler yapıldı. Belirli bir hamlenin öne çıkmadığı beşinci oyunda ise, AlphaGo bu sefer, go oyunun en incelikli ve önemli özelliklerinden biri olan, rakiple değiştokuşun (takas) üst düzey örneklerini verdi ve böylece yorulmak bilmeyen hesaplama gücünün yanında başka bir özelliğini de bize göstermiş oldu.

Bu seriyi ilginç kılan yönlerden biri, amatör oyuncuların oyunlarını temel alıp kendi kendiyle oynayarak örüntü ağlarını geliştiren AlphaGo’nun, yalnızca insandan kesin olarak üstün olduğu hesaplama gücüne dayanarak değil, neredeyse iyi bir go oyuncusunun sezgisiyle eşdeğer bir değerlendirme sistemine dayanan belirli bir yaratıcılık edindiğini göstermesi oldu.(3) AlphaGo, iki profesyonel oyuncu arasındaki bir maçta, kötü olarak nitelenebilecek amatör bir hamleyi, bir şekilde oyunlarında en optimum şekilde kullanarak, rakibe göre yepyeni bir strateji geliştirmeyi başardı.

Yapay zekâ go oyununun gelişmesine aracı olabilir

Bu ağır yenilgiye karşın, önce büyük bir şaşkınlık yaşayan go severler, yine de esprili bir dille insana olan inancını yitirmediklerini gösterdi. [Kahveli Görsel] Fotoğrafta esprili bir biçimde ifade edildiği gibi, 12 volt gibi düşük bir enerjiyle çalışan insan beyniyle AlphaGo’nun tükettiği enerjiyi karşılaştırınca, go oyununda olmasa da genel olarak “üstünlüğümüzün” hâlâ devam ettiğini söyleyebiliriz. Yine de seriden önce ve seri boyunca yapılan insan ve yapay zekâ karşılaştırmaları, kendine olan sarsılmaz güveniyle bilinen Lee Sedol’ü, oyun sırasındaki gergin hallerini de hatırladığımızda, etkilemiş gözüküyor. Seriyle ilgili yapılan yorumlardan bazılarında da, uluslararası basının yoğun ilgisi ve sanki insanlığı temsil ediyormuş gibi bir hava oluşması nedeniyle, Lee Sedol’ün daha önce yaşamadığı bir baskı altında oynadığı öne sürüldü. Lee Sedol de bunu onaylarcasına, ikinci maçtan sonra yapılan basın toplantısında, kendisinin insanlığı temsil etmediğini, ancak büyük bir baskı altında hissettiğinin doğru olduğunu açıkladı. Ne olursa olsun, seriyi kaybetmiş olsa da, go oyununa daha önce görülmedik savaşçı bir stil kazandıran ve oyundaki savaşçılığının tersine gerçek hayatta son derece alçakgönüllü biri olan Lee Sedol, verdiği büyük mücadele ve en azından 4. maçtaki doğaüstü hamlesi nedeniyle her halükârda kutlanmayı hak ediyor.

AlphaGo ve Lee Sedol’ü altyapısı ve kullandığı enerji açısından kıyaslayan esprili bir görsel.

Sonuç ne olursa olsun, yapay zekâ dışında go oyunu için de bu serinin bir dönemeç olacağı şimdiden kesin gibi. Başlarda bilgisayara karşı yenilmenin go oyununa olan ilgiyi azaltacağını düşününenler, bugünlerde dünya çapında go oyununa olan ilgi patlaması karşısında şaşırmış durumda. İnternet üzerinden go ekipmanı yapan siteler, yoğun talep nedeniyle ekipman kıtlığı yaşadıklarını ilan etmeye başladılar bile. Deep Blue’nun Kasparov’a karşı galibiyetinden sonra satranca olan ilginin azalmayıp tersine arttığını düşünürsek, aynı şey go için de olacak gibi. Go’ya olan ilginin artmasının yanında, halihazırdaki go oyuncuları için de yepyeni bir evren açıldığını söylemek mümkün. AlphaGo’nun yeni ve sürpriz hamleleri, daha önce kötü sayılan hamleleri bir şekilde avantaja çevirmesi, go oyununun mükemmelleşmesine ve yaratıcılığın artmasına da katkıda bulunacak. Çinli yazılımcıların AlphaGo’ya bir rakip geliştirmeye başladığını ve profesyonel oyuncuların AlphaGo’yu yenecek taktikler geliştirmek üzere gruplar kurduğunu da eklersek, go ve yapay zekâ camiasını yepyeni heyecanların beklediğini söyleyebiliriz.

Dipnotlar

1) Go oyunu iki şekilde sona erer. Ya oyunculardan biri kazanamayacağını anlar ya da oyun sonunda yapılan alanların puanları sayılır.

2) 9 dan, goda profesyonel seviyede en yüksek aşamadır.

3) Burada kullanılan “sezgi”, “öğrenme” gibi kavramların yapay sinir ağında ne anlama geldiğini AlphaGo temelinde anlatan bir makaleyi, ilerleyen sayfalarda okuyacaksınız.