Framuga i żelazko.

W toku produkcji prędzej, czy później każdy sięga po magiczne trio: kompresor, limiter i bramkę.

O ile dotychczas narzędzia te były kojarzone były przede wszystkim z działaniami umożliwiającymi osiągnięcie maksymalnej głośności nagrania (tak, znowu loudness war), o tyle obecne stosowane mechanizmy w domenie cyfrowej dystrybucji muzyki zachęcają do zmiany sposobu myślenia względem tej grupy maszyn przesuwając je raczej do listy instrumentów dedykowanych kreowaniu brzmień.

Nolens volens zanim przejdziemy do tzw. rozkminy nad tymi zabawkami, wypadałoby się przyjrzeć sytuacji ogólnej.

Zjawisko loudness war jest niemal tak stare, jak sama fonografia. Bezpośrednią przyczyną jego pojawienia się była potwierdzona późniejszymi badaniami obserwacja zmiany postrzegania jakości dźwięku w zależności od poziomu jego głośności. Mówiąc krótko: im głośniej, tym lepiej.

Ten drobny szczegół bardzo szybko, jak zwykle w takich przypadkach, dostrzeżony przez ludzi odpowiedzialnych za sprzedaż nie tylko muzyki, ale i reklam w telewizji i radiu, został wyzyskany i już wkrótce okazało się, iż cała sytuacja wymaga odgórnej standaryzacji mediów w zakresie norm natężenia dźwięku.
Do lat 1980-tych trend pozostawał w ryzach. Z jednej strony domena analogowa wymuszała niejaką ostrożność w ciągłym wzgłaśnianiu nagrań – brak jednolitej granicy maksymalnej głośności, naturalna kompresja będąca cechą immanentną nośników etc, z drugiej strony tam, gdzie zbrakło ograniczeń technologią, porządku strzegły standardy, przepisy, instytucje i ewentualnie wściekli odbiorcy.

Eksplozja nastąpiła w momencie wprowadzenia na rynek cyfrowych nośników audio.
Domena digi z założenia ogranicza w sposób bezdyskusyjny maksymalny poziom dźwięku. Nie ma miękkiej granicy dodatkowych 6 dB, w których następuje naturalna kompresja sygnału, dodatkowo wzmocniona saturacją. Jest za to sufit, który przy bezpośrednim spotkaniu miażdży wszystko do poziomu 0 dBFS masakrując bezlitośnie dźwięk.

Jeśli jednak istnieje nieprzekraczalna twarda granica, to korzystając z różnych technik można do tej granicy dążyć w nieskończoność pompując głośność do punktu, w którym RMS (średni poziom) jest niewiele mniejszy od wartości szczytowych (peak).

W ten sposób w ciągu niecałych 40 lat statystyczny poziom RMS (http://pl.wikipedia.org/wiki/%C5%9Arednia_kwadratowa) nagrań wzrósł o ok. 12 dB i obecnie – zależnie od gatunku i poziomu produkcji, osiąga od -3, do -0,5 dB.

Ujmując istotę problemu nieco bardziej obrazowo…

audio compression

Wszechobecność trendu, i sytuacja, do jakiej doprowadził nie tylko przez wyśrubowanie norm, ale też przez przyzwyczajenie do nich słuchaczy, zapędziły nas w kozi róg, w którym zapewne dalej byśmy tkwili bez szans na rozwiązanie, które jednak przyszło ze zgoła nieoczekiwanej strony.

W roku 2001 Apple otworzył sklep iTunes, którego główną innowacją było wprowadzenie sprzedaży pojedynczych piosenek. Odtwarzacze mp3 wyposażone w niezbędne technologie, umożliwiały tworzenie dowolnych list odtwarzania.

Zaskakującym jednak kłopotem okazały się różnice w głośności między poszczególnymi utworami. Gdyby odtwarzacze były nadawcami RTV, szybko pojawiłaby się instytucja odpowiedzialna za standaryzację, ale że sprzęt konsumencki nie podlega takim rygorom, standaryzację opracowano dopiero w roku 2012, odpowiadając na zapotrzebowanie sklepów internetowych i serwisów streamingowych, które zaczęły implementację algorytmiki odpowiedzialnej za pomiar i normalizację poziomów głośności muzyki do jednego wspólnego natężenia głośności.

Dokument  p.t. Algorithms to measure audio programme loudness and true-peak audio level., opisany sygnaturą Recommendation ITU-R BS.1770-3 (08/2012) zawiera pełną metodologię zaawansowanych systemów pomiaru średniego natężenia dźwięku na potrzeby ich normalizacji do emisji (broadcast, streaming).

Problem, który leży u podstaw takiej standaryzacji w odniesieniu do sygnału audio, polega na określeniu warunków które z jednej strony utrzymają rygor średniego poziomu głośności, z drugiej nie ulegały przekłamaniom wynikającym z chwilowych zmian dynamiki (peak, akcenty, crescenda i decrescenda), czyli uwzględnią wszelkie aspekty psychoakustyczne percepcji dźwięku.

Skutek? Można sobie dalej produkować przekompresowaną muzykę, ale traci to sens, bo nie będzie ona nigdzie grana głośniej, a przy usunięciu dynamiki zabrzmi tylko gorzej od utworów w rzeczywistości cichszych, które jednak dzięki zastosowaniu odpowiednich algorytmów staną się głośniejsze w najistotniejszych punktach: nagłych wzgłośnieniach, akcentach, uderzeniach etc.

Jeśli wierzyć opinii Andrew Schepsa (jeden z najlepszych specjalistów w dziedzinie mixu i masteringu na świecie), to trend zacznie słabnąć z czasem, wraz z implementacją standardu przez studia realizatorskie, nadawców i dystrybutorów, oraz wraz z pojawiającymi się wynikami finansowymi.

Jak więc widać, kompresja i limiting prawdopodobnie przestaną być główną domeną procesu masteringowego, co nie oznacza, że można zacząć się ich pozbywać
(jeśli wszakże zechcecie wyrzucać swoje kompresory – zwłaszcza te conajmniej średniej klasy – na skip, dajcie znać w komentarzach, chętnie przyjadę i zabiorę – najlepiej lampowe).
Kompresory i bramki (limitery już w mniejszym stopniu) stanowią świetne narzędzia przy definiowaniu brzmień i poziomowaniu elementów miksu, ponadto małe jest prawdopodobieństwo iż znikną z linii efektowych w masteringu.

To powiedziawszy możemy skupić się na obrazowym wytłumaczeniu działania poszczególnych maszyn. A jest ich cała rodzina oparta na jednym głównym mechanizmie: analizie głośności wchodzącego sygnału, która staje się potem parametrem decydującym o konkretnej modyfikacji dźwięku.

Zależnie od typu urządzenia może to być odcięcie sygnału (bramka), wyciszenie o różnej sile (kompresor, limiter), lub wzgłośnienie (expander).

Ta metoda działania wzmocniona o bazujące na analizie FFT cięcie na pasma wzbogaca powyższą kolekcję o całą stertę kolejnych urządzeń, z których wyciągnę dla przykładu tylko trzy:
+ kompresor wielopasmowy, w którym tor audio zostaje rozdzielony na ustaloną ilość równoległych linii przesyłających przefiltrowane pasma do oddzielnych kompresorów,
+ korektor dynamiczny, którego wybrane pasma w aktywny sposób reagują zmianą głośności wraz ze zmianą natężenia dźwięku w tych obszarach częśtotliwościowych,
+ najmniej może oczywisty przykład: vocoder, który na podstawie dźwięku rozciętego na pojedyncze – podlegające analizie głośności – pasma, moduluje (w tych samych pasmach) inny na ogół sygnał. Proste? …Nie?
Ok.
W portfelu masz, drogi Czytelniku, 20 zyli w papierze, 15 w plastiku, oraz 3 zeta w blachach. To jest sygnał wejściowy modulacji w podziale na pasma. Sygnałem wejściowym nośnej w adekwatnym podziale jest kawa, tytoń, i zapałki.
Rezultatem modulacji będą dwie kawy (dwakroć po dziesiątaku), ramka fajek (powiedzmy to – 15 zyga za pakę: żyjemy na bogato) i ok. 12 paczek zapałek (przybliżony kurs drewna opałowego: 25gr za pudełko, daje nam żelazny zapas na najbliższy tydzień wichur).
Wraz ze zmianą ilościową poszczególnych grup zawartości portfela zmieni się ilościowy rozkład Twojego menu śniadaniowego.

Jak więc widać, analiza poziomu głośności jest jedną z podstaw technologicznych sporej części urządzeń używanych w studiu, a zasada działania – na tyle prosta, że można ją streścić w ten oto sposób:

Wydawać by się mogło, iż tyle wystarczy tytułem wiedzy technicznej, tu jednak pojawiają się pewne szczegóły w dość znaczący sposób wpływające nie tylko na sposób działania wspomnianych urządzeń, ale i zagrożeń związanych z degradacją jakości dźwięku, jakie one powodują.

Dźwięk będąc z natury falą złożoną z przebiegów sinusoidalnych o różnych okresach (http://pl.wikipedia.org/wiki/Transformacja_Fouriera) nie podlega przekształceniom w sposób jednolity. Czas trwania jednego pełnego cyklu to zakres od ok.0,05 ms (20 kHz) aż do 50 ms (20 Hz), zatem nie tylko poziom odcięcia i siła przetworzenia ma wpływ wyjściowe brzmienie, ale również czas reakcji. A trzeba pamiętać, że urządzenia oparte na opisanym powyżej mechanizmie z definicji działają z opóźnieniem.

Następnym istotnym ograniczeniem prędkości reakcji mechanizmu wynikającym z natury dźwięku, jest częstotliwość dolnej granicy pasma przetwarzanego dźwięku.
Będąc sumą drgań o różnych częstotliwościach dźwięk zmienia okresowo swoją głośność przynajmniej kilkanaście razy w ciągu sekundy, a częstotliwość tych oscylacji jest bezpośrednio skorelowana z częstotliwością najgłośniejszej składowej.
To oznacza, że skrócenie czasu działania np.: kompresora do okresu zbliżonego do częstotliwości owej składowej będzie miało katastrofalne konsekwencje dla sygnału wyjściowego. Zamiast kompresji zyskamy distortion.

W przypadku urządzeń stosujących dodatkowo algorytmikę opartą na FFT, a więc analizę częstotliwościową sprawy komplikują się jeszcze bardziej, bowiem każde pasmo mając odmienne, graniczne okresy drgań, podlega analizie w innym czasie.
A skoro modulacja polega na rozcięciu dźwięku na poszczególne pasma, to wraz ze wzrostem ich ilości rośnie również – często wbrew intencji użytkownika – ingerencja w charakter dźwięku (zmiany fazowe).

O takich drobiazgach warto pamiętać sięgając po urządzenia mające poprawić dźwięk.

* * *

Sto tysięcy artykułów, tutoriali, omówień i wszelkiego autoramentu innych materiałów znajdziesz drogi Czytelniku, w sieci, dlatego też postaram się napisać sto tysięcy pierwszy poczynając od rzeczy najprostszej. Kto bogatemu zabroni?

Bramka (gate).
Ten nieskomplikowany moduł służący wyciszeniu fragmentów nieistotnych dla miksu najczęściej stosuje się (jak mniemam) nagrywaniu partii wokalnych i instrumentalnych przy użyciu mikrofonów.
Tam gdzie pojawia się to, co istotne, potencjalny szum tła jest elementem z przymusu akceptowalnym, co nie oznacza, że jesteśmy nań skazani w trakcie pauz.

Działanie bramki definiują cztery podstawowe parametry:
+ poziom odcięcia (threshold, dB)
+ czas reakcji (attack, ms)
+ czas uwolnienia (release, ms)
+ głośność wyjściowa odcinanego sygnału (floor, dB)

W praktyce działanie wygląda, jak następuje:
narastający od ciszy dźwięk jest przyciszony do podanej wartości (floor) dopóki nie przekracza ustalonego poziomu głośności (threshold), po przekroczeniu którego zostaje wzgłośniony w odpowiednim czasie (attack) do oryginalnego poziomu. Gdy tylko głośność dźwięku opadnie poniżej poziomu granicznego (threshold) zostanie on wyciszony w czasie (release) do głośności (floor).

W bardziej rozbudowanych wersjach bramki pierwotny threshold zostaje rozbity na poziom odciecia wejścia (threshold) i wyjścia (return, hysteresis), a domena czasowa – wzbogacona o parametr podtrzymania (hold).
W takich przypadkach, po przekroczeniu poziomu (threshold) bramka wzgłośni dźwięk do jego pierwotnego natężenia w ustalonym czasie (attack) i nie wyciszy bez względu na wejściowy poziom przez zdefiniowany czas (hold), dopiero potem, gdy poziom dźwięku okaże się niższy od zakładanego (return) zostanie on wyciszony do poziomu (floor) w zakładanym czasie (release).

Tyle tytułem odcinania zbędnego tła, niektóre bramki jednak mogą działać również na odwrót, co oznacza, że odcięcie nastąpi w taki sam sposób, gdy dźwięk stanie się głośniejszy od wartości progowych.

Bramka zatem, jak większość opisywanych tutaj urządzeń, jest dość ograniczona: nie analizuje charakteru sygnału, a tylko jego głośność, pracując na zasadzie “wszystko, albo nic”.
Ponadto decydując się na jej użycie dobrze jest pamiętać o dodatkowych ograniczeniach wynikających z parametrów ataku i uwolnienia, ustawienie zbyt krótkich czasów spowoduje nienaturalne odcięcia, zbyt długich utratę istotnych części początku sekwencji interesujących nas dźwięków (attack) oraz zbędne ogony na ich końcu, co przy zaszumionych próbkach nie zawsze jest wskazane.

Limiter.
Znany również, jako brick wall compressor, bowiem tym w zasadzie jest – zmodyfikowaną odmianą kompresora, używaną do radykalnego ograniczenia głośności do ustalonego poziomu – za wszelką cenę.
Podstawowe parametry limitera, to:
+ poziom odcięcia (threshold, ceiling, dB)
+ czas uwolnienia (release, ms)

Zasada jest tu prosta: każdy dźwięk przekraczający pewien ustalony poziom głośności (threshold) zostaje brutalnie ściszony do tego poziomu w najkrótszym możliwym czasie, po opadnięciu natężenia dźwięku wejściowego poniżej tego poziomu (threshold) limiter przywraca w zdefiniowanym czasie (release) oryginalną głośność.

Z uwagi na siłę bezpośredniej ingerencji w kształt fali (sprasowanie wierzchołków fali) limiter jest potencjalnie śmiercionośną bronią, gdy idzie o wpływ na jakość dźwięku.

Limiter

Co widać na powyższym skrinie?
Sygnał (przebieg sinusoidalny, vol. -0.5 dB) przechodzi przez limiter
(threshold -24 dB), potem gain (transparetny, + 24 dB) dla wyrównania poziomu do stanu pierwotnego. Przed limiterem oraz na końcu łańcucha znajdują się analizatory spektralne ukazujące różnice.

Przy okazji nadmienię, iż to właśnie z dźwiękiem, chociaż dużo subtelniej, robią wszelkiego rodzaju saturatory, o których jednak – innym razem.

Po co więc używać limiterów, skoro są tak zdradzieckie? Bezpieczeństwo jest chyba głównym, jeśli nie jedynym powodem. Aby uniknąć niepożądanych skoków głośności, takich jak wszelkiego rodzaju wizgi, peaki, dobrze czasem zabezpieczyć łańcuch efektowy limiterem, zwłaszcza, gdy balansujemy na granicy sprzęgu – ceny, jaką trzeba czasem zapłacić choćby za eksperymenty z najciekawszym chyba elementem zabawy dźwiękiem: feedback loopem.

Ale limitery to również gwarancja, iż również dźwięk niepoddany tak radykalnym przetworzeniom nie wyrwie się spod kontroli i da się dozować z aptekarską dokładnością leżącą u podstaw tak istotnych dla ostatecznego brzmienia procesów, jak premastering (ogół prac technicznych mających na celu retusz, ujednolicenie i przygotowanie materiału do replikacji) i mastering (bezpośrednie prace związane z wykonaniem płyty matki na potrzeby tłoczenia).

Można więc nie bez podstaw domniemywać, że limiter poza szczególnymi przypadkami jest pozostaje w zasadzie bezużyteczny. Jest też w tym sporo racji, bowiem w większości sytuacji lepszą opcję stanowi jego bardziej ogarnięty brat:

Kompresor (compressor).
Urządzenie działające na podobnej zasadzie, ale dające większą swobodę działania z uwagi na zasadniczo rozwinięty – względem limitera – mechanizm.
Oprócz parametrów threshold (poziom odcięcia) i release (czas uwolnienia), pracę kompresora definiuje jeszcze kilka innych:
znany nam już skądinąd attack (czas reakcji), oraz:
+ siła kompresji (ratio, stosunek [input]:[output])
+ kolano, czyli szerokość krzywej wzrostu parametru ratio (knee, dB).

Jak to działa w praktyce?
Ratio określa stosunek w jakim zostanie zmniejszona początkowa głośność dźwięku po przekroczeniu progu (threshold); jeśli głośność pierwotnego sygnału spadnie poniżej wartości progowej, w ustalonym czasie (release) zostaje przywrócona oryginalna dynamika sygnału. Tyle teorii – czas na jakiś przykład (tym razem z odrobiną arytmetyki).

Sygnał wejściowy:
biały szum narastający powoli od ciszy do poziomu 0 dBFS (maksymalna głośność w domenie cyfrowej), potem powolne wyciszenie.
A) Parametry kompresora:
ratio: 2:1
threshold -12 dB
attack 50 ms
release 100 ms

…aaaaand ACTION!

Dźwięk narasta do poziomu -12 dB, w tym momencie ingeruje kompresor. W ciągu 50 ms płynnie zmienia dynamikę sygnału wg schematu: aktualna głośność liczona względem poziomu -12dB (threshold) zostaje zmniejszona w stosunku 2:1 (ratio). Rezultatem tego, po osiągnięciu swojej maksymalnej głośności sygnał będzie zredukowany z 0 do -6 dBFS:
-12 + ( 0 – (-12)):2 = -12 + 6 = -6
Gdy oryginalny sygnał z powrotem cichnąc minie granicę -12dB (threshold), kompresor w ciągu 100 ms (release) przywróci oryginalną dynamikę.

B) modyfikacja ustawienia kompresora:
knee: 6 dB

…aaaand ACTION!

Sygnał wejściowy narasta bez ingerencji kompresora do poziomu -18 dB (threshold – knee), od tego momentu w ciągu 50 ms (attack), wraz ze wzrostem natężenia sygnału rośnie stosunek (ratio) z jakim dźwięk wyjściowy zostaje skompresowany, aż do osiągnięcia ustalonej wartości 2:1, przy poziomie wejściowego natężenia -6 dB (threshold + knee). Odtąd, przez punkt maksymalnej głośności, aż do ponownengo osiągnięcia poziomu -6 dB kompresor będzie pracować z nominalną siłą (ratio 2:1). Wraz z dalszym spadkiem głośności w ciągu 100 ms (release) rozpoczyna się proces płynnej redukcji ratio, by którego ograniczenie do stosunku 1:1 zakończy proces ingerowania w dynamikę przetwarzanego dźwięku z chwilą minięcia przez sygnał wejściowy poziomu -18 dB.

Sytuacja robi się nieco zawikłana, gdy weźmiemy pod uwagę, iż w większości przypadków nie kompresujemy dźwięku narastającego w powolny, majestatyczny sposób, a sygnał o szybkim ataku i relatywnie krótkim wygłosie. W takich sytuacjach często wychodzą na wierzch skutki poóźnienia w reakcjach kompresora.

Szybki, zdecydowany atak dźwięku powoduje niemal natychmiastową odpowiedź kompresora, której złagodzeniu właśnie służą zarówno attack, jak i knee.
Gdyby nie dwa powyższe parametry, oraz release, użycie kompresora skutkowałoby powstawaniem brzydkich peaków i nagłych skoków głośności. Dlatego właśnie właściwy dobór tych wartości ma kolosalne znaczenie dla skuteczności i minimalizacji dodatkowych zniekształceń powodowanych przez kompresor.
Zbyt krótki attack może skutkować zbyt szybkim zduszeniem dźwięku podbijającym tym samym tylko jego sam początek, w ekstremalnych przypadkach uwypuklając szczególnie wyższe składowe. Podczas, gdy zbyt długi – może uniemożliwiać kompresorowi skuteczne działanie.

Biorąc pod uwagę szybkość reakcji dostępnych kompresorów (dotyczy to w szczególności software’u) trzeba wziąć poprawkę na jeszcze jedno niebezpieczeństwo: redukcja czasu reakcji kompresora może doprowadzić do sytuacji, w której zamiast całego dźwięku zacznie on reagować na każdy cykl oddzielnie, zamiast kompresora zyskujemy saturator.

przykładowy saturator

Poniższy skrin ukazuje przyczynę tego zjawiska.

Limiting - oscyloskopy.

Parametry kompresora: thresh. -70dB, ratio 1:max, attack 0,01 ms,
release 1 ms, normalizacja + 16 dB.

Każdy wierzchołek (i dolina) fali zostaje ścięty, co powoduje zmianę jej kształtu. Im większa jest amplituda względem częstotliwości fali, tym zbliżu się ona do przebiegu kwadratowego, będącego sumą parzystych harmonicznych (wyłączając z podziału fundamentalną, a tak chyba powinniśmy je liczyć).

Równie poważnym problemem, tym razem w skali makro, może być ciasno zbita seria dźwięków przetwarzanych przez kompresor: zbyt długi względem gęstości dźwięków czas parametru release oraz ewentualnie zbyt szeroki zakres kolana, mogą mieć negatywny wpływ na głośność kolejnych z serii – kompresor po nie nadążając z powrotem do stanu bezczynności wyciszy kolejne, zostawiając z powodu opóźnienia w reakcji (attack, knee) tylko początek pierwszego dźwięku w serii.

Z uwagi na wspólny mechanizm działania ograniczenia te dotyczą w oczywisty sposób również limitera i bramki.

Warto w tym miejscu wspomnieć, iż kompresor ma swoje alter ego: expander, działający na tej samej zasadzie, z jedną różnicą: jego ratio przyjmuje odwrotne wartości , tj. 1:x. Tam, gdzie pierwszy przycisza, drugi wzgłaśnia.

* * *

Tak oto docieramy do urządzeń urządzeń bardziej zaawansowanych.

Kompresor wielopasmowy (multiband compressor, oraz – domyślnie: expander wielopasmowy, czyli multiband expander).
Jest to esencja zła wcielonego, wilk pośród Twej trzody, zdrajca, którego lepiej trzymać pod kluczem… potencjalny fuck up w klarowności Twojego brzmienia.
Czemu tak ostro?

Jak już zostało powiedziane, domeną dźwięku, jako zjawiska fizycznego jest czas, a dokładniej każdy możliwy jego okres zawarty w przedziale od 0,05 ms do 50 ms,
czy może inaczej mówiąc: wszystkie, możliwie naraz.
To bogactwo może powodować pewne konkretne ograniczenia, gdy w grę wchodzi podział dźwięku na pasma częstotliwościowe, a więc przesiewanie do jednego z (na ogół trzech, lub czterech w przypadku rodziny “multibandów”) worków podług “grubości śrutu”.

Po podziale, każde pasmo przechodzi przez dedykowany mu kompresor, a przetworzone pasma – zmiksowane z powrotem w jedną całość.

Każde z pasm wymaga innych czasów reakcji – pamiętajmy, że różnica w długości fal granicznych częstotliwości słyszalnego pasma dźwięku to z grubsza 10000 razy (rozstrzał na tyle duży, iż określenie “różnica” wydaje się dość niefortunne).
Jeśli wierzyć specjalistom, cięcia (crossover) powodują skutki uboczne w postaci rozsunięcia w fazie (w części bonusowej spróbuję przeanalizować przyczyny tego stanu rzeczy). Co oznacza, że już samo włączenie kompresora wielopasmowego do łańcucha efektowego ma wpływ na zmianę brzmienia – nawet gdy pozostaje pasywny.

Z tego też m.in. względu nie nadaje się do dynamicznej korekcji brzmienia, bowiem nie dość, że jest niedokładny (crossover – jeśli wierzyć zasobom Internetu – złożony jest z filtrów o relatywnie małym Q), to jeszcze ograniczony raptem do kilku pasm.

Dlatego właśnie lepszym rozwiązaniem jest dynamiczny korektor (dynamic equalizer), który łączy zaawansowane rozwiązania minimalizujące zmiany fazowe dźwięku, z dostosowaną do nich analizą głośności. W rezultacie otrzymujemy narzędzie, które w aktywny sposób ingeruje z ustaloną siłą w dźwięk w wybranych punktach pasma, resztę pozostawiając możliwie bez zmian.

* * *

Cechą wspólną omawianych maszyn, o której wstyd nie wspomnieć, jest możliwość zmiany domyślnego źródła sygnału podlegającego analizie (sidechaining). Innymi słowy używając jednego sygnału modulujemy drugi.
– Pompeczka na basie? Proszę bardzo.
– Docisk blach szumami? Włala.
– Sznary wyskakują przed kik? Już nie wyskakują.
– Kibordy psujo klymacik? Panie, kibordy nie psujo na rączke zajawke. Do bitu tylko czysta trójka.

Żarty żartami, ale jednak – jakkolwiek wszystkie ze wspomnianych urządzeń są już same w sobie potężnymi narzędziami, to sidechaining przenosi ich możliwości w nowy wymiar, umożliwiając bezpośrednią interakcje pomiędzy pierwotnie niepowiązanymi ze sobą źródłami dźwięku, które dopiero w miksie mają stać się monolitem.

Skoro już w ramach przeszliśmy do zastosowań, przyjrzyjmy się kilku podstawowym technikom, skupiając się przede wszystkim na kompresorze.

Stosowanie kompresji w odniesieniu do kluczowego zakresu dynamicznego (nie ma takiej nazwy, ale metoda, jak najbardziej istnieje).
Z opisem takiej metodologii spotkałem się dotychczas tylko raz, tym niemniej ze względu na osobę, która ją prezentowała, postanowiłem zapamiętać, nie siląc się przy tym na konotowanie nazwiska – starczyło mi wiedzieć, że gość jest jednym z tych twardszych w temacie.
Sed ad rem. Jako, że mówimy wciąż o głośności (dynamice), możemy rozpatrzeć ją jako trzy niezależne warstwy, w których dźwięk wykonuje konkretne, charakterystyczne dla nich akcje. Idąć od góry czyli rejonów, gdzie dźwięk jest najgłośniejszy (wartości są tu czysto umowne i raczej przedstawiają przybliżone rzędy wielkości):

  1. Headroom (0 ~ -24 dBFS): na ogół pustka, czasem przecięta pojedynczymi akcentami stopy, albo werbla, rzadziej talerzy, innych instrumentów;
  2. miejsce akcji (-24 ~ -48 dBFS): tutaj koncentruje się największa ilość instrumentów i dźwięków, tu również pojawiają się te najistotniejsze dla utworu;
  3. tło (poniżej -48 dBFS): przez większość czasu (przynajmniej w kluczowych fragmentach utworu) na tym poziomie pozostają wyłącznie elementy uzupełniające panoramę: szumy, efekty etc.

Przy takim podziale można kalibrować threshold kompresji na dwa poziomy głośności, są nimi granice między opisanymi obszarami. Pierwszy z tych punktów jest oczywistym wyborem, za którym pójdzie większość – zmniejszenie dynamiki headroomu to wszak naturalne rozwiązanie. Skorzystanie jednak z drugiej opcji daje efekt niemal równie potężny, a przy tym dużo subtelniejszy, bo i ratio należy w takim przypadku ledwie tknąć (1,1:1 ~ 1,2:1) pilnując, aby parametrami attack, releaseknee, zapewnić dużą miękkość kompresji.
Wydaje się to niewielką ingerencją, ale warto pamiętać, że tak ustawiony kompresor działa w zasadzie bez przerwy, a przestrzeń na której może ingerować to od 30, do nawet 60 dB. Niewiele zatem trzeba, żeby wyrwać dodatkowe 6 dB.

Na potrzeby takiego podejścia istnieje również podział samych kompresorów ze względu na ich sposób działania.

  • Downward compression, czyli schemat, wg którego działają typowe urządzenia:
    Ingeruje w dynamikę powyżej punktu threshold (ratio definiuje zatem obszar ponad nim);
  • Upward compression, schemat odwrotny: ingerencja kompresorów tego typu przebiega w obszarze poniżej threshold ( do niego też – naturą rzeczy – odnosi się ratio).

Bardziej zaawansowane urządzenia mogą łączyć w sobie oba typy kompresji dublując przy tym stosowne parametry.

Kompresja równoległa (parallel compression, new york compression).
Pełna kompresja sygnału (100% wet) może powodować utratę naturalnego brzmienia wynikającą z nadmiernego zmniejszenia dynamiki. Rozwiązaniem jest w tym przypadku dodatkowe wzmocnienie kompresji i zmiksowanie sygnału przetworzonego (wet) z czystym (dry). Co prawda większość (jeśli nie wszystkie) kompresorów zaopatrzona jest w parametr dry/wet, ale czasem warto zignorować tę opcję wstawiając kompresor (100% wet) na wydzielony kanał BUS i w miarę potrzeb wysyłać do niego sygnały z poszczególnych kanałów.

Działanie takie daje możliwość elastycznej modyfikacji sygnału mającego podbić średnią głośność miksu: wystarczy zmienić zestaw kanałów, lub też nawet głośności poszczególnych spośród już wysyłanych, by radykalnie zmienić atmosferę utworu. Drugim zyskiem z takiego kroku jest możliwość dodatkowej rozbudowy łańcucha efektowego w samym kanale kompresora. Filtrowanie, korekcja, saturacja, pogłosy etc., wreszcie sidechain compression (najlepiej na końcu łańcucha efektowego) – wszystko to pozwala wzbogacić brzmienie utrzymując całość miksu w ryzach.

Kompresja szeregowa (serial compression, cascade compression).
Nie jest to technika sensu stricto, ile raczej dość skuteczna metoda obejścia problemu degradacji dźwięku spowodowanej nadmierną kompresją.
Zamiast więc jednego urządzenia o nieprzyzwoicie wyśrubowanych parametrach, można postawić szereg (czasem bardzo różnych kompresorów), z których każdy ma niewielki wpływ dźwięk. Jednak cała ich kaskada przy ostrożnie dobranych parametrach jest w stanie skutecznie skompresować sygnał bez znaczącego wpływu na jego jakość.

Powyższe rozwiązania mogą służyć zarówno poprawie faktury, czy głośności całego miksu, jak i jego konkretnych sekcji, a nawet poszczególnych instrumentów.

W tym kontekście zarówno kompresor, jak i limiter, mogą posłużyć do osiągnięcia ciekawych rezultatów.

  • Zmatowienie ataku perkusjonaliów (gate: wysoki threshold, attack conajmniej 5 ms, floor conajmniej -3 dB),
  • nadanie sprężystości stopie (compressor: niski threshold, długi attack, krótki release, wysokie ratio, wysoki output level),
  • wzmocnienie werbla (parallel; reverb: długi predelay, średni decay, full wet; compressor: średni threshold, duży out level, średni dry/wet; gate: sidechain dry signal, sredni threshold, długi attack, floor -inf.)
  • uprzestrzennienie stopy (techno klasyk – parallel; reverb: predelay ~1/8, full wet; compressor: sidechain dry signal, krótki attack, duże ratio, średni threshold, full wet)
  • przesterowywanie stopy (parallel; saturator: full wet; gate: sidechain dry signal, wysoki threshold, długi attack, średni release, floor -inf.)

Przykładów bezpośrednich zastosowań można by mnożyć w nieskończoność, te jednak wystarczą, aby pokazać, jak pomocne są owe urządzenia również przy bezpośredniej pracy nad konkretnymi brzmieniami.

Na koniec jeszcze jedna drobna uwaga, wokół której przez cały ten czas kluczyłem, nie mogąc wszakże wskazać bezpośrednio – swoisty święty graal:
Kompresory (a także limitery, ma się rozumieć), jak zapewne łatwo to było wychwycić z powyższego artykułu, nie wzgłaśniają dźwięku. Jedyne co robią, to poprzez zmniejszenie dynamiki wygospodarowują wolną przestrzeń (headroom), który potem można wykorzystać do podniesienia ogólnego poziomu dźwięku.

* * *

BONUS.

Miało się tu znaleźć całe mnóstwo bardzo teoretycznych dociekań n/t pewnych istotnych aspektów działania kompresorów (przede wszystkim software’owych), ale dziwnym zbiegiem okoliczności tych kilka ostatnich godzin wytężonego poszukiwania informacji, weryfikowania ich w drodze testów, składania w jednolity,
w miarę zrozumiały wywód, zakończył krytyczny błąd systemu…
– Uffff… – westchną niektórzy, co bardziej zmęczeni lekturą i rację mieć będą, dlatego też tym razem odpuszczę, chociaż spodziewać się będziecie mogli powrotu do tego tematu.

[]txt v.02

Advertisements

Leave a Reply

Fill in your details below or click an icon to log in:

WordPress.com Logo

You are commenting using your WordPress.com account. Log Out / Change )

Twitter picture

You are commenting using your Twitter account. Log Out / Change )

Facebook photo

You are commenting using your Facebook account. Log Out / Change )

Google+ photo

You are commenting using your Google+ account. Log Out / Change )

Connecting to %s