– avagy hogyan lesz a hangból hang –
Ez a mondat első olvasatra elírásnak tűnik, de ki fog derülni, hogy mégsem az. Szándékosan mutatunk rá egy dologra, mert az audio-technikában egy hangból előbb elektromos jel, majd rengeteg átalakítás után, az elektromos jelből újra hang lesz. A hangfelvételek első lépése, hogy a hang bekerüljön a rögzítő eszközbe. Ehhez mikrofonokat, vagy vonal szintű jeleket használunk, amit egy előerősítőn keresztül küldünk a hangrögzítő berendezésünkbe. Az egyszerűség kedvéért most csak a digitális rögzítésről lesz szó, de analóg eszközökre is ugyan ez vonatkozik.
A jel útja felvételkor. A jelforrást általában egy vezetéken keresztül küldjük a hangkártyánkra, interfészünkre stb. Ezen belül található egy erősítő áramkör, ami hajtja az Analóg-Digitális (A/D) átalakítót. Természetesen ennek az előerősítő áramkörnek is van egy optimális működési tartománya, ha túlhajtjuk torzítani fog, ha pedig kevés jelet kap, zajos és élettelen, vékony lesz a felvétel. A jel útja az A/D-átalakítón vezet tovább, ami az analóg hangot digitalizálja, hogy azt egy számítógép értelmezni és tárolni tudja. Ennek az áramkörnek szintén egy optimális jelszintre van szüksége a jó minőségű átalakításhoz. Ha eszközünk rendelkezik kivezérlés mérővel, az nagyon jó hír, hiszen azon jól látható a beérkező jel szintje. Az optimális jelszintet a DAW szoftverünkben is leolvashatjuk a felvételi csatorna kivezérlés (peak) mérőjén.
24bit vagy 16bit?
A régi időkben, amikor még csak 16 bites A/D-átalakítókat használtak a stúdiókban (és otthon), mindenki azt ajánlotta, hogy a lehető legnagyobb jelszinttel (0dBFS) vegyünk fel, hogy a legnagyobb felbontást tudjuk elérni, vagyis addig toljuk az előerősítő potiját felfelé, amíg csak túlvezérlés nélkül tudjuk. Ekkor persze a hangkártya előerősítője és az A/D-átalakító is jócskán az optimális működési értékek felett volt hajtva, főként pillanatnyi jelcsúcsok esetén (amit észre sem lehet venni a kivezérlés-mérő műszeren), ami torzítást és nemkívánatos dinamika változásokat vitt a felvételbe. Ezért mondták régebben, hogy a digitális technika hidegen, nem kellemesen szól – nem csoda, hiszen nem rendeltetés-szerűen használták!
A 24 bites A/D-átalakítók esetében is fennáll ez a veszély, de ezeket már nem kell csúcsra járatnunk, hogy a 16bit-nél sokkal jobb felbontást érhessünk el. Nem mellékes, hogy a 24 bites felbontás 126 dB dinamikatartománynak felel meg, ezt a jobb stúdió mikrofonok tudják csak, ami máris sokkal jobb, mint amit egy CD valaha is tudott.
Újabb kérdés, hogy az éppen használt interfész a valóságban milyen SNR (signal to noise ratio), azaz jel/zaj-viszonnyal rendelkezik. Ugyanis attól, hogy 24 biten továbbítja az adatokat, még nem biztos hogy képes is azokat ilyen széles dinamikatartománnyal kezelni. A legjobb mai konverterek 124 dB-el rendelkeznek, egy átlagos pedig 98-100 körül. Tehát hiába is vezéreljük ki a felvételt 0dBFS-re, abból a 24 bitre eső 144 dB-ből csak 100 lesz hasznos, a maradék 44 pedig zaj. És persze túlvezérelt is lesz… A jelszint kezelés lényege, hogy minden a felvételi láncban lévő egységnek a neki leginkább megfelelő jelszintet biztosítsuk, azaz egy egészséges jel-zaj viszonyt tartsunk fent.
Milyen jelszinttel készüljön a felvétel?
A tartalékról sokat lehet hallani, angolul Headroom-nak hívják és egy nagyon fontos dolog ahhoz, hogy a zene igazán jól szóljon. A zene nem egy statikus zaj, hanem izgő-mozgó ritmusos energia, aminek helyre van szüksége ahhoz, hogy lélegezni tudjon, akár csak egy jó táncosnak ahhoz, hogy ne csak egy helyben topogjon.
A „jó öreg” tradicionális analóg hangrendszerünk a 0VU-értéken érzi magát a legjobban, ami ugye +4dBu értéknek felel meg. A VU-méterek átlag értéket mutatnak, tehát nem jelzik a jelcsúcsokat! A profi analóg technika kb. +24 dBu jelszint elviselésére van tervezve, tehát +20 dB (+24dBu-4dBu=20dB) tartalékkal rendelkezik a 0 VU felett. Az analóg VU-métereken ez a plusz 20 decibel tartalék nincs feltüntetve, a VU skála csak +3 dB-ig van jelezve!
A digitális peak-méterek természetesen mutatják ezt a +20dB-t is, ezért sok hozzá nem értő úgy gondolta, hogy ki kell használni ezt is és túlvezérli az áramköröket, amik soha nem voltak arra tervezve, hogy egy ilyen +20 dB-es értéken működjenek (a +20dB = 10x nagyobb feszültség). Arról nem is beszélve, ha az előadóművész egy kicsit hangosabban muzsikál, akkor lehetett elölről kezdeni a felvételt…
Egy tipikus analóg keverőpult zajszintje általában -100 dBu, ha ehhez hozzáadjuk a +24dBu még elviselhető jelszintet, 124 dB dinamikatartományt kapunk, ami kb. megfelel a mai 24 bites profi hangkártyák dinamikatartományának.
32 bit Floating point felvétel?
Sok DAW felkínálja felvételi formátumnak a 24 bit mellett a 32 bit-et is. Jó, ha tudjuk, hogy a 24 bites konverterünk soha nem fog 32 biten digitalizálni, sem lejátszani. Ezt az opciót akkor használjuk, ha a felvételt már eleve olyan plugineken keresztül készítjük, amik erősítik/processzálják a beérkező hangot. De, ez a formátum sokkal nagyobb tárhelyet és processzor teljesítményt igényel!
A helyes kivezérlés és a tartalék nemcsak felvételkor fontos, hanem lejátszáskor is. Amennyiben a jelek zenei tartalmát meg is kívánjuk hallgatni, és nem csak a hullámformákban gyönyörködni a képernyőn, kénytelenek vagyunk a digitális formátumból analóggá visszaalakítani (D/A-konverter). Ekkor is nagyon fontos, hogy ne terheljük túl az áramköröket. Az erősítőre ezért szerelték rá a hangerő gombot! Viszont tartsuk szem előtt, hogy az ajánlott hangerő szint a szoba méretétől függően 74-85 dB/SPL! Az ennél magasabb hangnyomásszinttel történő hosszútávú zenehallgatás halláskárosodáshoz vezet! Ezt senki nem szeretné elszenvedni.
A helyes jelszint kezelés végig kísér a felvételtől a zenehallgatásig. A hangosabb zenét általában jobbnak halljuk, ez fülünk és hallásunk működési módjából adódik. Amikor két hangsugárzóból teljesen azonos hang szólal meg egy időben, akkor azt kétszer olyan hangosnak fogjuk hallani, mintha csak az egyikből szólna. Ez teljesen logikus és érthető. Két hangforrás dupla annyi levegőt mozgat meg, mint egy. Miért is fontos ezt nekünk tudni? Két fülünk van, ezért logikus módon a zenék általában sztereóban hallhatóak. A sztereó teret általában három részre osztjuk fel: bal, közép és jobb „csatorna”. Ha egy azonos hullámformájú, fázisú, frekvenciájú és amplitúdójú hang egyforma erősséggel szól a bal és a jobb oldalról is, és mi pont a két hangszóró között félúton helyezkedünk el, azt középről halljuk, bár középen nincsen egy harmadik hangszóró.
A pszicho akusztika miatt ezt egy középről érkező mono hangnak érzékeljük, és nem jobb és bal oldalon egyszerre jelenlévő sztereónak. Ezt a jelenséget nevezzük fantom középnek -azaz valójában nem létező középnek. Amikor a jobb oldali hang amplitúdóját (azaz hangerejét) csökkenteni kezdjük, az eddig középről érkező hang iránya elkezd balra (az ellenkező oldalra) elmozdulni. Amikor a jobb oldali hangszóró hangereje nullára csökken, a hangot már csak a bal oldali hangszóró felől halljuk. Ekkor viszont már csak egy hangszóró mozgatja a levegőt, vagyis a hangunk hangnyomásszintje a felére csökkent. Ez a jelenség a zenében nem kívánatos, ugyanis nem túl jó amikor egy szóló hangszer (ami leginkább mono hangforrás) a sztereó térben jobbra-balra mozogva halkul és hangosodik.
Nem kell tudósnak lenni ahhoz, hogy jó minőségű hangfelvételt készítsünk, csupán be kell tartani néhány alapszabályt, amit az előttünk járó hangmérnökök tapasztaltak ki.
– cikkünk a microchips-sound-studio oktatóanyaga alapján készült –