Müziğin otomatik olarak sınıflandırılması bilgisayar bilimleri açısından oldukça önemli bir problemdir. Kestirme bir yöntemle müziğin içerisindeki bilginin analizini yapmak, bu konuda yardımcı olabilir.
İletişim, uzayın bir noktasında yaratılan bir mesajın başka bir noktada yeniden üretim süreci olarak tanımlanabilir. Birçok bilimci ve mühendis tarafından derinlemesine araştırılan bu konudaki en büyük etkiyi, şüphesiz ki iletişimin matematiksel temsili yapmıştır.
Mesajın detayları matematikçilerin ilgi alanlarına girmez; önemli olan tek şey mesajların bir dizi düzenli sembol halinde ifade edilebilmesidir. Uzun süredir de bilinmektedir ki, bahsi geçen düzenli sembol seti, ilk olarak Claude Shannon’un iletişimin matematiksel teorisi çalışmalarında özetlediği üzere, belli başlı yasalar tarafından düzenlenmektedir.
Dil, bir kişiden başka bir kişiye bilginin aktarımını içermektedir ve bilgi teorisi de bu konudaki çalışmalara ve dilin doğasına yeni bir perspektif kazandırır. Bilgisayarlı hesaplamalar, verilerin bir yerden başka bir yere aktarılmasıyla gerçekleşir ve bilgi teorisi bu aktarımın en etkin biçimde gerçekleşmesini sağlayan teorik arkaplanı oluşturur. Canlıların çoğalması da benzer şekilde genetik bilgi mirasının sonraki nesillere aktarımı olarak bilgi teorisi çerçevesinde ele alınabilir.
Müzik de en temelde bilginin taşınımıyla ifade edilebilir. Ancak bilgi teorisi kullanarak müziği karakterize etmek ve doğasını anlamaya çalışmak, şimdiye dek bilimcilere pek başarı kazandırmamıştır. Şimdi ise Venezuela Simon Bolivar Üniversitesi’nden Gerardo Febres ve Klaus Jaffé, bilgi teorisini kullanarak yaptıkları çalışmada müzik türlerini ayırmayı ve bilgisayarların müziği sınıflandırma problemine bir çözüm getirmeyi başardılar.
Bilgi teorisi ve müziğin zor uzlaşmasındaki en önemli sebep, müziğin kolay kolay yukarıda bahsi geçen düzenli sembollere indirgenememesidir. Farklı enstrümanların aynı anda farklı notaları çalması ve her enstrümandaki farklı tını, şiddet vb. diğer özelliklerin hesaba katılmasıyla işler karmaşıklaşır. Tüm bunları ve müzisyenin kişisel yorumunu da hesaba katarak bir dizi sembolle ifade etmek oldukça zor bir uğraştır.
Febres ve Jaffé bu problemi son derece basit bir biçimde ele alarak, müziği dijital hale getiren standart MIDI (Müzik Enstrümanları Dijital Arabirimi) dosyalarını kullandılar. MIDI dosyası, müzik parçalarının dijital hale getirilmiş biçimidir ve bilgisayardan elektronik enstrümanlara kadar birçok elektronik ekipman tarafından okunabilir formattadır.
Her MIDI dosyası, orjinal müziğin tonu, hızı, ses şiddeti, titreşimi vb. tüm özelliklerini içerir. Bu mekanizma da müziğin bir yerde yaratılıp başka bir yere hatasız aktarılmasına olanak tanır. Öte yandan MIDI dosyasının kendisi de 0 ve 1’lerden oluşmuş bir dizi ikili bilgisayar kodundan başka bir şey değildir ve bu da Febres ve Jaffé’nin MIDI dosyaları üzerinden standart bilgi teorisini kullanmalarına olanak verdi.
Dosyaları “.txt” formatında açan araştırmacılar, ortaya çıkan rasgele görünümlü sembolleri okumaya başladı. Bilgi teorisinin güzel tarafı şudur ki, Mars’a gönderilen mesajları sıkıştırmak için veya bir dilin bileşenlerini analiz etmek için kullanılan yöntemler herhangi bir dizi sembole de uygulanabilir; Febres ve Jaffé’nin yaptığı da buydu.
Her bir diziyi orjinal müziği elde etmek için gereken minimum sayıya sıkıştırarak işe başlayan araştırmacılar, bu temel dizi ile her bir müzik parçasına eşlik eden entropiyi veya bilgi içeriğini ölçümledi. Entropinin zamanla değişimini de gözlemleyen araştırmacılar, 15 farklı tür müzikten 71 bestecinin 450 parçasındaki ikinci dereceden entropi farklılıklarını çalıştı. Elde ettikleri sonuçlar ise oldukça şaşırtıcıydı: Aynı türdeki müziklerin ikinci dereceden entropi değerleri benzer değerler alıyordu. Çalışma buna ek olarak müzik türlerinin zamanla evrimi hakkında da bilgi vermekteydi.
Müzik çalışmalarında yeni ve ilginç ufuklar açan bu çalışmanın elbette sorunları da var. Bazı müzik türleri kesin şekilde ayırt edilebilirken, bazı türler ise çakışabiliyor. Örneğin Venezuella ve Hindistan Raga müziği, parametre uzayında oldukça geniş yerler kaplıyorlar. Bazı klasik besteciler ise uzayda belirli bölgelerde bulunuyor ve bu da ayırt edilmelerini kolaylaştırıyor. Öte yandan klasik müzik ile rock müzik büyük ölçüde çakışmaktadır ki, buradan da iki müziğin otomatik olarak ayırt edilmesinin zor olduğu anlaşılmaktadır. Daha kapsamlı verilerle ileride yapılacak çalışmalar, belki de bu çakışmayı azaltacak yeni bilgiler ortaya koyabilir.
Febres ve Jaffé, geniş uygulama olanakları sunan bir teknik kullanarak önemli bir çalışma ortaya koydular. Müzik tavsiye sistemleri gibi birçok uygulama alanına entegre edilebilme potansiyeli olan bu yöntem gelecek vaat ediyor.
Kaynaklar
– http://www.technologyreview.com/view/542506/musical-genres-classified-using-the-entropy-of-midi-files/
– arxiv.org/abs/1510.01806