Turing testi, 1950’li yıllarda İngiliz matematikçi ve bilgisayar bilimcisi Alan Turing tarafından, bir makinenin düşündüğünü söylemenin mantıksal olarak mümkün olup olmadığına karar vermek için tasarlanmıştır. Teste göre, bir insan; bir insan ve bir yapay zekâyı (AI) bilgisayar aracılığıyla sorguluyor ve hangisinin yapay zekâ olduğuna karar vermeye çalışıyor.
Haziran başlarında pek çok gazetede bir yazılımın Turing testini geçmeyi başardığına dair haberler yapıldı. Buna göre yarışmaya katılan beş yazılımdan, yazılım mühendisi Rus Vladimir Veselov ve arkadaşlarının tasarladığı, 13 yaşındaki Eugene Goostman adlı bir çocuğun kişiliğini taşıyan yazılım jüriyi gerçek bir insan olduğuna ikna etmeyi başardı. Daha doğrusu, testi geçmiş sayılmak için jürinin yüzde 30’unu ikna etmesi gerekiyordu ve 30 jüri üyesinin 10’unu 5 dakikalık konuşmalar sonucunda ikna etmeyi başardı. Böylece Turing testini geçen ilk yazılım olarak duyuruldu.
Bu haberlere karşılık, pek çok köşe yazarı, yazılımın Reading Üniversitesi’nde düzenlenen bu yarışmayı kazanmasının Turing testini geçmeyi başarmış olduğunu göstermediğini belirtiyor.
Güvenilir değil
Çünkü yüzde 30 oranın, 30 kişilik jürinin ve 5 dakikalık süre limitinin sonuçların güvenirliği için yeterli olmadığı düşünülüyor. 1990’da Turing testini modernize eden Hugh Loebner, testin 25’er dakikalık konuşmalarla 4 jüri üyesi tarafından yapılması ve yazılımın jürinin en az yarısını insan olduğuna ikna etmesi gerektiği söylüyor.
‘Chatbot’ yapay zeka mı?
Eugene gibi anahtar sözcükleri tarayıp veri tabanından cevap seçen, ‘chatbot’ olarak tasarlanmış yazılımların yapay zeka tanımına uyup uymadığı da tartışılıyor.
Ayrıca Eugene’in 13 yaşında ve anadili İngilizce olmayan bir çocuk olması tasarımcıların bir çeşit hilesi olarak görülüyor. Veselov, Eugene’i “her şeyi bildiğini sanan ama elbette her şeyi bilmeyen bir genç” olarak tasarladıklarını ve onu bunun inandırıcı kıldığını belirtiyor.
Turing testiyle ilgili eleştiriler de var
Bazı bilim insanları, Turing testiyle makinelerinin düşünüp düşünemeyeceğine karar verilemeyeceğini belirtiyorlar.Bu oyunun bir yapay zekâyı test etmek için doğru bir yöntem olmadığını ve gerçek zekâdan öte, onun kandırma yeteneğini ölçtüğünü söylüyorlar.
Eugene aynı zamanda 2012’de katıldığı bir yarışmada yüzde 28 başarı sağlamıştı. İşte o yarışmadan bir konuşma:
Jüri: Ne tür müzikten hoşlanırsın?
Eugene: Eminem’i severim.
Jüri: Aman Tanrım! Eminem’e bayılırım. En sevdiğim sanatçıdır.
Eugene: Eminem’in anlamını merak ediyorum. Sadece “enema” (lavman) sözcüğüyle ilişkilendirebiliyorum. O çok klas biri, “The Real Slim Shady” parçasını seviyorum.
Jüri: Adının anlamını ben biliyorum. Gerçek adı Marshall Mathers. Baş harfleri M&M “Eminem” şeklinde okunuyor.
Eugene: O ünlü bir “rap”çi. “Stan” ve “The real Slim Shady” parçalarını seviyorum.
Jüri: Ben “Hailie’s”i seviyorum.
Eugene: İlginç zevkler. Ben bilim-kurgu kitaplarını severim. Bu arada, sen nerelisin? Yaşadığın yerden bahseder misin?
Jüri: Epsom. Derby’nin memleketi. Sen?
Eugene: Hint domuzum Derby’nin kulağa hoş geldiğini söylüyor.
Jüri: Bir ara onunla konuşmalıyım.
Eugene: Bence yazma dersi almalısın. Doğru düzgün yazsana.
Jüri: Bu çok kabaca?
Eugene: Ummm… Açıkçası sorunu anlamadım. 🙁
Jüri: “Umm” bir kelime değil. Bence sen yazma dersi almalısın.
Eugene: Bence de öyle. Bu arada, hala mesleğini bilmiyorum. Söyledin de ben mi kaçırdım?
Kaynaklar
1) http://www.theguardian.com/technology/2014/jun/09/what-is-the-alan-turing-test
2) http://www.buzzfeed.com/kellyoakes/no-a-computer-did-not-just-pass-the-turing-test
3) http://www.popsci.com/blog-network/boxplot/did-chatbot-really-pass-turing-test#7ljgigHBtsD51QpP.01
4) https://www.techdirt.com/articles/20140609/07284327524/no-supercomputer-did-not-pass-turing-test-first-time-everyone-should-know-better.shtml