Bunu tam anlamıyla anlatmak çok zor zira çok kapsamlı ve karışık teknik detayları olan bir konu, ama özetle şöyle anlatayım:
Dijital bilgi bir kere distorsiyona uğradığı anda onu bilahere 3dB aşağıya çekmiş olman seni o dijital distorsiyondan kurtarmıyor, bu bir.
AD girişindeki veya DA çıkışındaki sinyalin seviyesini gösteren VUmetreler adı üzerinde VU metre, sana ani peak değerlerini vermiyor, sadece RMS (ortalama) seviyeleri gösteriyor. Metreyi Peak'leri gösterecek şekilde ayarlasan bile ölçü cihazlarının da bir sezi yoğunluğu var, buna da bir çeşit sampling resolution diyebiliriz. Yani şöyle diyelim, kullandığın ölçüm paneli sana sinyalin peak'e girip girmediğini bildirecek. Burada ölçü ne? Dijital ortamda diyelim 16 bit uzunlukta 0dB'in ifadesi yukarıda da söylediğim gibi 1111 1111 1111 1111. Şimdi, sinyal geldi, ölçü aleti 16 tane 1 okudu, bu 16 tane 1 okuma 5 sample titreşimi boyunca devam etti, ki bu CD standardı 44.1 kHZ örneklemede 11 mikrosaniye demek, o distorsiyonu kulağının algılayıp algılayamayacağına sen karar ver, sonra sinyal aşağı düştü normal seyrine devam etti. Şimdi, gelen sinyal clipping'e uğradı mı uğramadı mı ölçümü yapan birim nereden tayin edecek? Zira sen digital headroom'un tamamını kullandın, ölçümü yapan birim sinyalin orada gerçekten 1111 1111 1111 1111'e vurduğundan dolayı mı o değerlerde olduğunu, yoksa 16 tane 1'den daha öteye gidemediği için mi 5 sample boyunca 0dB'de kaldığını (yani kırılmaya uğradığını) nereden tayin edecek? Buralara girdiğin zaman çok ciddi kalibrasyon problemleri ile karşılaşıyorsun. Bunlar sen miksaj yaparken kulağına problem olarak görünmeyecek kadar küçük distorsiyonlar olabilir, oysa aynı distorsiyonlar miksajda üstüste eklene eklene gelip mastering aşamasında mühendise kan kusturan, çoğaltıma gönderildiğinde CD fabrikasında ciddi sorunlar oluşturabilen detaylar.
Ayrıca eğer 24 bit çalışıyorsan sinyal seviyesini illa da 0dB'e veya -3dB'e kadar yükseltip "hot" olarak kaydetmen veya işlemen de gerekmiyor. Tam aksine, kayıdı 24 yaptığın sürece kayıtlı sinyallerinin en yüksek noktalarının -12dB civarında, averajının -20dB dolaylarında seyretmiş olması bile sana aslında inanılmaz bir dinamik aralık veriyor. Zira 24 bitte temsil edebileceğin dinamik aralık 144 dB, insan kulağının duyabildiği en düşük ses seviyesi ile tahammül edebildiği en yüksek seviye arasındaki dinamik aralık ise 110 dB mi ne, sen 144dB'in tepesinden 20 dB traşlasan boşluk bıraksan bile aşağıda kalan aralık ihtiyacın olandan fazla.
Dithering denen olayda sinyalin dijital olarak temsil edilemeyen kısımlarındaki detayları da yukarı çekip temsil edebilmek için sinyalin içerisine kasıtlı olarak bir gürültü ekleniyor. (Bu arada bu planlı olarak yapılan birşey, siz sakın "vay, dithering'de sinyale gürültü ekleniyormuş, ben şu 'dithering yap' kutucuğunu boşaltayım da sinyalime gürültü eklenmesin" filan sakın demeyin.) O gürültü ekleme esnasında sinyalin tabanı zaten yukarı doğru offset ediliyor, bunun yanı sıra "quantizing distortion" denen, dijital olarak ses kısıp açmalarda veya frekans işlemelerde oluşan bozulmaları önlemek veya aza indirgemek için gerekli headroom'u sağlamak için de floating point denen bir teknik uygulanıyor. Bütün bunlar da bazan sinyalin tepe headroom'undan yiyor. Siz sinyali tepeye dayadığınız anda bu işlemler için manevra alanını yoketmiş oluyorsunuz. Bilgi bir kere bozulmaya uğradıktan sonra onu -3dB değil, -23dB de aşağıya alsanız birşey düzelmiyor.
"Analog sesi bir kere dijital bilgi haline dönüştürdün mü bir daha o bilgiye hiçbirşey olmaz" demeyin. O çok yanlış bir kanı ve birçok insanı bir yığın yanlış yapmaya itiyor. Oysa dijital olarak kaydedilmiş bir sesi -3dB kıstıktan sonra öyle "overwrite" yaparak "destructive" metodla kaydettiğiniz anda sesten bir yığın şeyi aslında kaybediyorsunuz. Onu tekrar "3dB louder" yapmanız veya normalize yapmanız o kaybolan detayları size geri getirmiyor.
Şöyle örnek vereyim:
Sinyalinizin analog ortamdaki voltaj değeri 0.55 Volt. Sizin noktanın sağında temsil edebilme haneniz iki. Sinyali dijital olarak örnekleyip çevirip kaydettiniz. Sonra dijital ortamda sinyali -6dB zayıflattınız. -6 dB sinyali yarı yarıya zayıflatmak demek, dolayısı ile sizin sinyalinizin voltajı analog ortamda onlu bazda 0.275 Volt olmalı. Ama sizin noktadan sonra iki basamaktan fazla temsil şansınız yok, zira bit adedi belli, onun ne kadarının noktanın sağına ne kadarının soluna kullanılacağı da belli (fixed point prensibinden bahsediyoruz şimdi), dolayısı ile sinyalin yeni halini 0.27 veya 0.28 olarak kaydetmek durumundasınız. Sonra işiniz düştü, sinyali tekrar 6dB yükseltmek zorunda kaldınız ve dijital olarak 6dB yükselttiniz, yani ikiye katladınız. Ne oldu? Yeni değer analog ortamda ya 0.54 veya 0.56 oldu. Oysa sinyalin aslı 0.55 idi.
Bunu engelleyebilmek için bit uzunluğu içerisinde noktanın yerini belirleyen hanenin yerinin ileri geri kaydırılabilmesi lazım ki gerektiğinde o ilave küsurat için yer açılabilsin (floating point prensibi yani). Bunun için de bit uzunluğunun en solundaki bitlerin gerekmedikçe kullanılmaması gerekiyor. Siz sinyali dijital ortamda sona dayayıp kaydedince sistemin elinden bu silahı alıyorsunuz, çok gereksiz bir şekilde elinizi kolunuzu bağlıyorsunuz.
Sinyal 24 bit olarak sample edilmesine rağmen son zamanlarda sistemlerde iç işlemlerin standart olarak 32 bit floating point, hatta en son sistemlerde 64 bit floating point olarak yapılmasının ardında da bu "quantizing distortion" denen olay yatıyor. Bütün uğraş o bozulmayı kulağın algılayabilme aralığının dışına itebilmek. "Non-destructive editing" prensibinin de ardında aynı mantık var, sinyalin ilk halini mümkün olduğunca kaybetmemek.
Eğer İngilizceniz varsa o sabit "Miksaj" başlığında bahsettiğim Bob Katz'ın "Mastering Audio" kitabını alın baştan sona okuyun. eğer İngilizceniz yoksa öğrenin, sonra o kitabı alın okuyun. Çünkü gördüğüm kadarıyla Türkiye'de Türkçe olarak yayınlanmış bu bilgileri verecek bir kitap yok, eğer bilen birisi varsa da henüz o bilgiden yeterince para kazandığını düşünmüyor ki kimseye birşey söylemiyor, sadece "-5 dB tavan boşluğu bırakın" deyip geçiştiriyor.
Sevgiler.