Ana sayfa 147. Sayı CERN ve büyük veri

CERN ve büyük veri

253
PAYLAŞ

Tarihsel olarak mihenk taşı olarak adlandırabileceğimiz yenilikler bazen devrim bazense evrim nitelendirilmesi yapılan isimlerle anılıyorlar. Geçmişteki üç endüstriyel devrime ve son 3-4 yıldır şekillenerek Endüstri 4.0 adını alan en son dönüm noktasına bakarken genellikle üstünde durmadığımız bir soru ise şu: insanlık “devrim” değerinde endüstriyel değişimler yaratabilecek buluşlar yapmak için güdümlü çalışmalar mı gerçekleştiriyor, nokta atış mı? Bunun cevabını aslında çok iyi biliyoruz ama kimi zaman hatırlamak işimize gelmiyor.

Okumakta olduğunuz yazının amacı bu noktadan sonra Endüstri 4.0 ifadesini hiç kullanmamak, neye işaret ettiğinden, tanımından, öngörülerinden söz etmemek. Tüm bunların yerine, ve de konuyu oldukça değiştirerek, bir grup deneysel yüksek enerji fizikçisinin katıldıkları araştırmalarda ihtiyaç duyulan araç ve yöntemlerden söz edilecek.

Bir deney yapmak istiyorsunuz, maddenin yapısını anlamak için ve bunu yerel laboratuarınızda yapmanızın imkanı yok çünkü gereken altyapıyı kurmak tek başınıza kolay değil; hatta ulusal bir program dahilinde bile gerçekleştirmek mümkün görünmüyor. Bunun farkında olarak başka ülkelerden biliminsanlarıyla birlikte uluslararası bir işbirliği kuruyorsunuz. Bunu gerçekleştirmenizi sağlayacak bir çatıya da ihtiyacınız var, şanslısınız çünkü CERN (Avrupa Nükleer Araştırma Teşkilatı) var; 1954’te kurulmuş, tam da bu amaçla. 80’lerin ikinci yarısında yapmak istediğiniz deneyin fikri oluşmuş olsun; CERN’i, başka bir deyişle insanlığı 21. yüzyıla taşıyacak proje. Önerilen projenin 90’larda artık resmen kabul edildiğini ve tasarım-üretim çalışmalarının çoktan başladığını düşünün; gerek ihtiyaç duyulan parçacık çarpışmalarını sağlayacak hızlandırıcının tasarımı, gerekse çarpışma sonucunda ortaya çıkanları algılayıp kayıt altına alacak algıç sistemlerinin. Fikrin ilk çıkışından yaklaşık çeyrek asır sonra deney yapılmaya başlasın ve daha önce ulaşılmamış enerjilerde gerçekleşen parçacık çarpışmalarında evrenin işleyişi ile ilgili yeni bilgilere ulaşalım. Öyle ki, deney başladıktan 2-3 sene sonra yaptığınız yeni bir parçacık keşfi o parçacığı yarım asır önce öngören kuramsal fizikçilerin Nobel fizik ödülünü almalarına neden olsun. Deneyin öngörülen son veri alma zamanı ise ~2035; yani yarım asırdan fazla bir süreçten söz ediyoruz. Tamam işte biliminsanının işi ne, araştıracak bulacak… Gelin şimdi biraz da  sayılarla konuşalım.

Sözü edilen çarpışmaları sağlayan hızlandırıcı yapısının adı Büyük Hadron Çarpıştırıcısı (LHC – Large Hadron Collider). Üzerinde dört büyük algıç sistemi kurulu ve bunlardan ikisi genel amaçlı çok büyük algıç sistemleri. Çok amaçlı algıç sistemlerinden biri olan ATLAS’ı (A Troroidal LHC ApparatuS) daha yakından inceleyelim. Yerin yaklaşık 100 metre altında kurulmuş, 45 metre uzunluğunda 25 metre çapında silindirik bir yapı, toplam kütlesi yaklaşık 7000 ton. Bu dev sistemde okunması gereken yaklaşık 100 milyon elektronik kanal var ve 3000 km’den fazla kablo kullanılmış. LHC her 25 nanosaniyede (saniyenin milyarda birinde) ~15 proton çarpışmasını algıç sistemimizin tam kalbinde gerçekleştirecek şekilde çalışıyor; başka bir deyişle saniyede ~600 milyon çarpışma. Bu sayı yakın gelecekte bir milyarın üzerine çıkacak. ATLAS’ın bu çarpışmalarla ilgili önemli bulduğu bilgiyi kaydetmesi gerekli. Yukarıda bahsettiğimiz 100 milyon elektronik kanalın hepsini dinleyip sadece önemli bilginin bulunduğu kısımları belirleyip kaydettiği durumda dahi veri hacmi saniyede 100.000 CD’yi dolduracak büyüklükte.

Bu devasa algıç sisteminin çalışması için yenilikçi yöntemler geliştirmeniz gerekli, hazır sistemleri kullanmanız mümkün değil. Algıç Kontrol Sistemi (DCS – Detector Control System) bunlardan biri. Tetikleme ve Veri Toplama (TDAQ – Trigger and data Acquisition) sistemi ise bir diğeri. Bu entegre algıç sisteminde yer alan onlarca farklı karakterdeki her alt algıç sisteminin çalışmasının kontrolü ve veri toplanmasının sağlanmasını istiyorsunuz. Bunu çevrimiçi olarak “anlık” görüntüleme ve müdahaleler ile gerçekleştirmeli, aynı zamanda çevrimdışı veri kalitesi kontrolleri yapıp kurulan karar mekanizmaları ile analiz edilecek veriyi belirlemeli ve kullanıma açmalısınız. Çevrimdışı yapılan değerlendirmeler dahi en çok 1-2 günde sonuçlanmalı. İş burada bitmiyor, bu verinin kaydedilmesi, analiz için hazır hale getirilmesi ve işbirliğindeki bütün fizikçilerin erişimine açılması gerekli; bu ise sadece CERN kaynaklarının kullanılmasıyla mümkün değil.

CERN 2002’de dünya genelindeki büyük hesaplama merkezleriyle (computing centers) kafes hesaplama (grid computing) denilen bir işbirliği oluşturdu. WLCG (Worldwide LHC Computing Grid) denilen bu dağıtılmış hesaplama altyapısı sayesinde LHC verisine yaklaşık 10 bin fizikçinin gerçek zamanlı erişimi mümkün oldu. İlk olarak 1999’da ortaya atılan fikirlerden şekillenmiş olan Grid sistemi, 1989’da CERN’de keşfedilmiş olan WWW (World Wide Web) teknolojisinin üzerine kurulmuştur ve çok aşamalı (tier) bir dağıtılmış hesaplama yapısıdır. CERN Veri Merkezi (CERN-DC: CERN Data Center) 10 binden fazla sunucu üzerindeki yaklaşık 100 bin işlemci çekirdeğine ve ~50 petabayt (peta = 1015) veri saklama imkanına sahiptir; sunucu tarlası (server farm) yaklaşık 1500 m2’lik bir alanda kuruludur. CERN-DC, LHC üzerinde toplanan deneysel verinin Grid’e gönderildiği ilk temas noktasıdır.  Sadece CERN veri merkezinde her gün yaklaşık bir petabayt (200 bin DVD’den daha fazla) veri işlenmekte ve veri tabanında saniyede 6000 değişiklik gerçekleşmektedir. Grid sisteminde ise günde iki milyondan fazla hesaplama işi çalışmaktadır.

Bırakın çığır açan bilimsel keşifleri, bu keşiflerin yapılması için biliminsanlarının ihtiyaç duydukları altyapı ve yöntemlerin gelişimi bile hayatımızda hiç hayal edemeyeceğimiz yenilikler yaratıyor. Yukarıda CERN’de 1989’da keşfedildiğine değinilen ve bugün hayatımızın vazgeçilmez bir parçası halini almış olan WWW sistemi bugünler düşünülerek mi tasarlandı? Hayır, farklı yerlerdeki biliminsanlarının işbirliğini kolaylaştırma ihtiyacından doğdu. Peki ya dokunmatik ekran, ne zaman ve nerede keşfedildi dersiniz? Bugün kullandığımız tabletler ya da akıllı telefonlar için mi ihtiyaç duyduk? Hayır, ilk olarak CERN hızlandırıcı birimlerinden biri olan SPS’in (Süper Proton Sinkrotron) kontrol panelleri için 1973’te icat edildi. Yine aynı yıl, CERN SPS’nin kontrol panelleri için geliştirilen bir diğer icat olan ve avuç içi ile idare edilen top şeklindeki iz sürücü cihazın çalışma prensibi 1980’lerde geliştirilen bilgisayar faresinin çalışma prensibi ile aynı; tesadüfe bakın!

Şimdi, birisi büyük veriden, nesneler internetinden ya da her şeyin internetinden mi söz ediyor? 20. yüzyılın son 10 yılında biliminsanlarının ihtiyaçları sayesinde icat edilen WWW ve şekillenen Grid sistemini unutmayın. Hemen ardından, 21. yüzyılın ilk yıllarında, LHC deneylerinde yer alan fizikçilerin veri işleyebilmeleri için kurulmuş olan ve dünya geneline dağıtılmış bir hesaplama sitemi olan WLCG kafes yapısını tekrar düşünün. Böylece endüstrinin evrildiği yeni yapının ne sayede mümkün olduğunu daha kolay görebiliriz.

Prof. Dr. Serkant Ali Çetin,
Prof. Dr. Sedat Ölçer,
Doç. Dr. A. Özgür Toy

İstanbul Bilgi Üniversitesi, Mühendislik ve Doğa Bilimleri Fakültesi

Kaynaklar

– http://home.cern/

– http://wlcg.web.cern.ch/

– http://home.cern/topics/large-hadron-collider

– http://atlas.ch/

– https://cds.cern.ch/record/1248908