İnsanları farklı oyunlarda yenmeyi başaran yapay zekâ geliştirildi
Yapay zekâ şirketi DeepMind, 49 farklı oyunu oynamayı öğrenen Deep Q isimli tek bir sistem geliştirdi. Bu sistem, oyunların yarısında insanları yenebilecek kadar yetenekli hale geldi.
DeepMind’ın kurucusu Demis Hassabis önderliğindeki araştırmacılar, oyunun kurallarını, oyunda yapması gerekenleri ve hedefini bilmeden bir oyunu oynamayı öğrenen Deep Q’yu anlattıkları makalelerini Nature dergisinde yayımladılar.
Esas başarı, insanlar gibi deneme-yanılma yoluyla öğrenen bilgisayar yapmış olmakta
Çalışmada Deep Q’ya sadece oyunun başlangıç sahnesini gösteren bir resim ve yukarı, aşağı, sağ, sol gibi yapabileceği hareketleri veren araştırmacılar, yapılan hareketin sonucuna göre ödül veya ceza vererek sistemin deneme yanılma yöntemiyle öğrenmesini sağladılar. Buna göre Deep Q oyun içerisinde yapabileceği hareketleri deneyerek bir skora ulaşıyor. Eğer bu skor bir önceki oyuna göre kötüleştiyse ceza puanı alıyor; eğer skorda bir artış varsa ödül puanı alıyor. Tıpkı sıcak bir şeye değen bir çocuğun elinin yanmasıyla sıcak nesnelere dokunmaması gerektiğini öğrenmesi gibi, Deep Q da yaptığı hareketin yanlış bir hareket olduğunu anlıyor ve öğreniyor.
DeepMind’ın kurucusu ve çalışmanın yazarı Hannabis “Başarılan şey oyun oynamayı öğrenen bir program yapmak değil, gerçek başarı aynı insanlar gibi sıfırdan, deneme-yanılma yoluyla bir işi öğrenen ve bu işte başarılı hale gelen bilgisayarlar yapmak. Deep Q beklenmedik durumlara adapte olup öğrenebiliyor ve bu, öğrenme açısından tüm sistemlerden daha insansı” diyor. SeaQuest isimli bir oyunda, Deep Q araştırmacıların hiç aklına gelmemiş bir stratejiyle oyunu kazanmayı başarmış. Çalışmanın ortak yazarı Volodymyr Mnih “Sizin düşünemediğiniz şeyleri keşfeden bilgisayarlar görmek gerçekten çok heyecan verici” diyor.
Çalışmanın bir başka önemine ise Carnegie Mellon Üniversitesi’nden Prof. Emma Brunskill vurgu yapıyor: “Bir iş için özelleştirmeyi gerektirmeyen bu sistem, bizi gerçek insansı yapay zekâya bir adım daha yaklaştırdı. Hiçbir ön bilgi gerektirmiyor olması gerçekten heyecan verici.” Daha önceki çalışmalarda gerçekleştirilen yapay zekâlar sadece tek bir problemin ya da durumun çözümünde kullanılabiliyor ve başka bir işi öğrenmesi mümkün olmuyordu. Bunun bir örneği ise IBM’in üretiği Deep Blue. 1997’de Deep Blue Dünya Satranç Şampiyonu Garry Kasparov’u yenmeyi başarmıştı. Ancak 49 farklı oyunu oynamayı öğrenen Deep Q’nun aksine Deep Blue sadece satranç oynayabiliyordu.
Alberta Üniversitesi’nden Richard Sutton, Deep Q’nun sinirbilim açısından da önemli bir yeri olduğunu düşünüyor. Sutton, “Biyoloji için meyve sinekleri neyse, yapay zekâ için de oyunlar odur. Oyunlar yapay zekâ araştırmacılarına minimal ortamlar sunar. Deep Q da anlaması oldukça zor olan zihin problemini anlaşılabilir parçalara ayırıp, sinirbilimciler tarafından çalışılabilir hale getirebilir” diyor. Demis Hassabis de aynı görüşte: “Sinirbilimciler zekâ ve karar verme mekanizmalarını anlamaya çalışıyor. İşte biz de onlara testlerini yapabilecekleri bir sistem sunuyoruz.”
Her şeye rağmen Hassabis’e göre Deep Q bir yapay zekâ değil. Bunu şu şekilde açıklıyor: “Deep Q bir oyunda öğrendiği bilgileri başka bir oyunda kullanamıyor. Yani öğrendiği şeyi aktaramıyor. Buna yaratıcılık ya da zekâ diyemeyiz. Dünya üzerindeki var olan bir şeyi keşfetmek demek daha doğru olur. Bana göre yapay zekâ diyebilmemiz için sistemin oynadığı oyunlar gibi bir oyun üretmesi gerekir.”
Çalışmayı yürüten araştırmacılar, bir oyun üzerinde gerçekleştirdiği öğrenmeyi, başka bir oyuna da uygulayabilen, Deep Q’yu bir adım öteye taşıyacak bir versiyon üzerinde çalışıyor. Bir başka versiyonun da insanların yaptığı gibi işi parçalara ayırıp, parçaları çözerek bütünü çözme yöntemini içermesi düşünülüyor. Asıl hedef ise, Hassabis’in de dediği gibi, gerçek yapay zekâya ulaşıp kendi kendine oyun yaratabilen bir sistem elde etmek.
Hazırlayan: Yusuf Can Semerci
Yeditepe Ünv. Bilgisayar Mühendisliği Blm YL
Kaynak:
– http://www.nature.com/news/game-playing-software-holds-lessons-for-neuroscience-1.16979
– http://phys.org/news/2015-02-hal-bests-humans-space-invaders.html?utm_source=menu&utm_medium=link&utm_campaign=item-menu