Ana sayfa 145. Sayı İnsan ve Yapay Zekâ, Go cephesinde karşı karşıya

İnsan ve Yapay Zekâ, Go cephesinde karşı karşıya

262
PAYLAŞ

Mehmet Barış Albayrak

Mart ayında ister AlphaGo insanın Go’daki hâkimiyetine son versin, ister Lee Sedol masa oyunlarında insanın yapay zekâya karşı son kalesini savunsun, insanın en zarif icatlarından biri olan Go oyunu, tüm bu zihinsel, etik ve sosyal beceri kazandırma özellikleriyle, insanlar arasında yaygınlaşarak oynanmaya devam edecek.

2016 yılı Go oyuncuları açısından oldukça heyecanlı başladı. Ocak 2016 yılında ilk kez bir profesyonel oyuncu, yapay zekâya karşı kaybetti. Fan Hui, her ne kadar aktif profesyonel oyuncular arasında üst seviyelerde olmasa da, birçok yazılımcı bile profesyonel bir oyuncuyu yenecek yapay zekânın geliştirilmesi için en azından bir on yıl daha beklememiz gerektiğini söylüyordu. Yapay zekâya büyük yatırımlar yapan Google’ın DeepMind şirketinde geliştirilen AlphaGo adlı program bu işi çok kısa sürede, hem de 5-0’lık ezici bir skorla kazanarak başardı.

AlphaGo’nun asıl büyük sınavı ise, Mart ayında, şu anda aktif en iyi oyuncu kabul edilen Güney Koreli Lee Sedol ile yapacağı beş maçlık seri olacak. Bir milyon dolar ödüllü bu seri, Go oyunu tarihi açısından büyük bir önem taşıyor. 1997 yılında IBM’in geliştirdiği DeepBlue programı, büyük usta Kasparov’u yendikten sonra, masa oyunları açısından yapay zekâya karşı insanın son kalesi Go oyunu kaldı. Bakalım Lee Sedol Mart ayında AlphaGo’ya karşı bu kaleyi savunabilecek mi?

Peki, Go oyunu yapay zekâya karşı kalesini nasıl bu kadar uzun süre koruyabildi? Bunun için öncelikle oyun oynayan bilgisayar kavramına ve satrançla Go’nun bu bakımdan farkına kısaca değinmekte fayda var.

Go oyunu

Çin’de icat edildiği düşünülen Go (Japonca: Go, Çince: Weiqi, Korece: Baduk), en eski masa oyunlarından birisidir. Go tahtası, 19 yatay ve 19 dikey çizginin kesişiminden oluşur. 180 beyaz, 181 siyah taş vardır. Oyuna siyah taşları alan oyuncu başlar. Oyuncu taşı istediği kesişim noktalarından birine koyabilir. Tahtaya konan taş hareket ettirilemez. Bir taş ya da taş grubu, etrafı çevrildiği zaman rakibin esiri haline gelir ve o zaman tahtadan kaldırılır. Ancak oyunun amacı rakibin taşlarını esir etmek değil, rakibin işgal edemeyeceği alanlar veya esir edemeyeceği gruplar yaratarak, tahtada rakipten daha fazla bölgeye hakim olmaktır. Hakim olunan alandaki kesişim noktaları, oyun sonunda puan olarak toplanır ve en çok puana sahip olan oyuncu maçı kazanır. Oyun iki türlü biter: Ya bir oyuncu kazanamayacağını anlayınca pes eder ya da oyun sonunda kim alanı (rakibin giremeyeceği kesişim noktaları toplamı) daha fazlaysa o oyuncu maçı kazanır.

Bilgisayar nasıl Go öğreniyor?

“Bir bilgisayar nasıl oyun oynar?” sorusunun yanıtı, “Bir insan nasıl oyun oynar?” sorusuna verilecek yanıta oldukça yakın olmalıdır. Oyun oynatmaya çalışılan bir bilgisayar, bir oyunu ilk defa öğrenen bir insana benzer. Tıpkı insanlarda olduğu gibi bilgisayarlar da oyunda yapılabilecek hamleleri ve oyunun nasıl kazanılacağını öğrenmeye oyunun kendisini oynayarak başlar.

Bilgisayara önce oyun içerisinde kullanabileceği aksiyonlar öğretilir. Örneğin, satranç için her taşın hamle yapısı, Go için tahtaya bir taş koyma, sonrasında ise o oyunun nasıl kazanılacağı öğretilir. Bilgisayar bu bilgilerle bir oyun oynar ve yaptığı hamlenin iyi mi kötü mü olduğunu geri bildirim olarak alır. Oyunu kazandığında elde edeceği, hedef olarak koyulan bir puanla artık bilgisayar bu oyunu gerçek anlamda oynamaya hazırdır.

Her iyi hamlesinde kazanacağı, her kötü hamlesinde kaybedeceği ve sonunda ulaşmaya çalıştığı hedef puanlarıyla kurulan bu mekanizmaya “Ödül Sistemi” denir. Ancak bilgisayarın oynadığı oyunun ödül sistemini bilmesi oyunu oynaması için yeterli değildir. Hangi hamleleri yaparak daha çabuk hedef ödüle ulaşacağı bilgisi “Karar Ağacı” denen mekanizmalar ile mümkündür. Bunun için “Ağaç Araması” denen mekanizmalara sahip olması gerekir. Bu mekanizmalara göre, bilgisayar, oyunun herhangi bir aşamasında yapabileceği tüm olası hamleleri bir ağaç yapısına yerleştirir. Daha önce programcı tarafından belirlenen kaç hamle ileriye dönük hesaplama yapacağı bilgisini kullanarak genişleteceği ağaçta yer alan en iyi ödül getirisi olan hamleyi seçerek oyunu oynamaya devam eder.

Klasik “Ağaç Araması” mekanizmaları satrançta oldukça başarılı olsa da Go’da bu mekanizmalar beklenen sonucu vermez. Bunun sebebi olarak, Go’nun satrançtan daha büyük bir tahtaya sahip olması ve olası hamlelerin satrançtan daha fazla olması gösterilebilir. Ancak asıl neden, bu iki oyunun oynanış dinamiklerinde yatmaktadır. Satranç oyununda tahta üzerinde kalan taş sayısı, rakipten alınan taş sayısı gibi bilgiler yeterli ön bilgiler olsa da, Go’da tek bir taşın tüm tahta üzerinde büyük sonuçlar doğurmasından ve Go’da eldeki ya da tahtadaki taşlardan ziyade rakibin fethedemeyeceği alanlara sahip olmanın daha önemli olmasından dolayı bu bilgiler yeterli değildir.

Bu nedenlerden dolayı Monte Carlo Ağaç Araması denen bir mekanizma geliştirilmiştir. Monte Carlo Ağaç Araması’na göre herhangi bir aşamada elde edilen olası hamleler arasından rastgele seçilen hamlelerle binlerce oyun oynatılarak bilgisayarın en iyi hamleyi öğrenmesi sağlanır. Bu mekanizma stratejik kazançlar sağlarken, taktiksel kayıplar vererek oyun oynamayı zorlaştırır. Diğer yandan AlphaGo programı, Monte Carlo Ağaç Araması ile klasik Ağaç Araması tekniklerini birleştirerek iki yöntemin de avantajlarını kullanmasıyla ilk defa profesyonel bir oyuncuya karşı üstünlük kurmayı başardı.

Şu anda aktif en iyi oyuncu kabul edilen Güney Koreli Lee Sedol, Mart ayında AlphaGo adlı program ile 5 maçlık bir seri oynayacak.

Go sadece Go değildir

Başta da belirttiğimiz gibi, günümüzde Go oyununda halen aktif olarak en iyi oyuncu olarak nitelenen Güney Koreli Lee Sedol ile maçlar Mart ayında. Yani AlphaGo henüz nihai zaferini elde etmiş değil. Ancak öyle görünüyor ki, bu Mart ayında olmasa da, kısa süre sonra en iyi oyuncuları yenebilen bir bilgisayar programı olacak. Elbette profesyonel oyuncuları yenebilen bir bilgisayar programının yapay zekâ için de büyük bir aşama olduğunu vurgulamak gerek.

Bilgisayar önünde sonunda Go’da insana üstünlük kuracak olsa da, Go’nun yalın kurallarından (1) ortaya çıkan karmaşık evreninin büyüleyiciliği kolay kolay kaybolacak gibi görünmüyor. Her şeyden önce bunun nedenini, Go oyununun yalnızca bir hesaplama ve strateji oyunu olmayıp, insanın bilişsel yetilerini geliştirmesi yanında, insana farklı konularda da kendini geliştireceği alanlar açmasında bulabiliriz.

Bunun için öncelikle oyunun Uzakdoğu’da algılanış biçimiyle ilgili bir örnek verebiliriz.

Go oyununun,  özellikle Uzakdoğu’da yalnızca bir masa oyunu olarak görülmediğini belirtmek gerekir. Örneğin Güney Kore’deki Myongji Üniversitesi’nde Go oyununa özel bir enstitü bulunmakta ve burada lisans eğitiminden doktoraya kadar öğretim verilmekte. Bu enstitüde, oyun bilgisini geliştirmenin yanında, “Go Oyunu ve Karakter Eğitimi” gibi derslerde, sorumluluk, dürüstlük, saygı ve hayal gücü gibi değerlerle Go oyunu arasındaki ilişki vurgulanmakta. (2)

Bunun dışında, yine başta Güney Kore ve Çin olmak üzere, üniversitelerde Go oyununun insan beynine etkisiyle ilgili pek çok araştırma yapılmakta. Güney Kore’de yapılan bir araştırma, yoğun konsantrasyon isteyen ama aynı zamanda meditatif bir yanı olan oyunun, dikkat eksikliği konusunda zorluk çeken çocuklara bu konuda yardımcı olduğunu ve çocukların bilişsel yetilerini geliştirdiğini gösteriyor. (3) Çin’de Alzheimer hastalarıyla yapılan bir başka araştırmada ise, oyunun bu hastalarda belleği güçlendirici bir etki yaratmanın yanında, depresyona da iyi geldiği belirtiliyor. (4)

Bunların dışında, hemen hemen tüm Uzakdoğu sporlarında olduğu gibi, Go oyunu, kişinin rakiple değil aslında kendiyle girdiği bir mücadele sürecini içermekte. Oyunda seviyeniz ilerledikçe, kendinizi daha fazla geliştirmek için, yalnızca taktik bilgi çalışmanın yetmediğini, oyun sırasında kendinizde gördüğünüz zayıflıkların da (açgözlülük, hırs, zor durumda kendine hâkim olma, yenilgiyi öğrenme, kazanmayı abartmama vs.) üzerine gitmeniz gerektiğini fark ediyorsunuz. Bütün bunların yanında, yurt içinde ya da yurt dışında Go oynanan mekânları ziyaret ettikçe, turnuvalara katıldıkça edindiğiniz dostlukların, bu oyunun size kazandırdığı en önemli artılardan biri olduğunu belirtmeyi unutmamak gerek. Kısacası, Mart ayında ister AlphaGo insanın Go’daki hâkimiyetine son versin, ister Lee Sedol masa oyunlarında insanın yapay zekâya karşı son kalesini savunsun, insanın en zarif icatlarından biri olan Go oyunu, tüm bu zihinsel, etik ve sosyal beceri kazandırma özellikleriyle, insanlar arasında yaygınlaşarak oynanmaya devam edecek.

Dipnotlar

1) İnternette oyunun kuralları ve temel stratejiler için oldukça faydalı siteler bulunmakta. Örn. http://playgo.to/iwtg/turkish/

2) Myongji Üniversitesi’nde Go oyunu üzerine yüksek lisans yapan Türk öğrencilerin kurduğu blogda bu dersler ve Go’yla ilgili başka bilgiler bulabilirsiniz: http://tasliyol.com/

3) http://www.ncbi.nlm.nih.gov/pubmed/24843369

4) http://www.ncbi.nlm.nih.gov/pmc/articles/PMC4548213/