Talán már minden High-End rajongó találkozott a Non-oversampling Digital filter-less, a túlmintavételezés nélküli koncepció alapján kidolgozott digitális/analóg átalakítókkal. A szótárakban nem található, kínnal kreált „szép magyar kifejezés” ritka elektronikát takar, bár a nyomozó zenekedvelő itthon is talál belőlük példányt. A non-over/upsampling koncepciót először Ryohei Kusunoki japán gondolkodó javasolta, majd a 47 Laboratory népszerűsítette, 1966-ban, háromrészes cikkében a következőket publikálta. Idézzük.
…”Az eredeti 16 bit / 44,1 kHz mintavételezésű formátumról kialakult kép megerősítéséhez valami izgalmas újat kellett létrehozni. Mindenkinek megvan a saját megközelítése. Voltak, akik forrasztópákát ragadtak, mások komputer szimulációt indítottak. Az én esetemben visszamentem az alapokhoz, kutakodtam a történelemben és újra építettem a teljes képet a fejemben. Ahogy a CD formátum új generációja (itt az SACD, HDCD, XRCD lemezekre gondolt) megjelent a láthatáron, úgy gondoltam, hogy az alapkoncepciónak a következőnek kell lennie. Az eredeti 44,1 kHz / 16 bit formátummal a kezünkben lévő CD-lemez pontosan ugyanazokat az adatokat kell tartalmaznia, mint a zenei anyag, amely elhagyta a stúdiót. Ennek az álomnak a felidézésére témánk nagyon megfelelő. Semmiféle nagybit egységű vagy többszörös mintavételnek nincs létjogosultsága, kivéve, ha meghaladja ezt a pontossági szintet. A jelenlegi technológia szerint a túlmintavételezést elvégezni meglehetősen nehéz.
Túlmintavételezés és a jitter. Két tengely van a hang digitalizálására. Az időtengely és az amplitúdó tengely. CD esetén ezek a 44,1 kHz és a 16 bit. Más szóval, az amplitúdó-adatokat másodpercenként 22,7-szer a 16 bites szakasz egyikébe kell benyomni. Ez legfeljebb +0,5 LSB hibát eredményez – a digitális hang a hiba elfogadásával kezdődik. Ez a hiba azonban csak az amplitúdó tengelyre vonatkozik, az időtengelyen nem észlelhető hiba mennyiség. Tegyük fel, hogy a 16 bites pontosság azt jelenti, hogy az akusztikus energia (idő x amplitúdó) pontosan továbbítódik a 16 bites lépésekre történő eloszlással. Ezután az amplitúdó adatok pontosabbá tételével eloszthatjuk a hibát az idő-tengelyre. Ha a hiba felét elosztjuk, 1 ÷ 44,1 kHz ÷ 2^16*;÷ 2 = 173 (ps) (*kettő a tizenhatodikon), ez az elfogadható hiba maximális határát jelenti (a jitter maximális korlátja).
A fentiek mindegyike az alap mintavételi sebességen alapul. Nyolcszoros túl-mintavétel és 20bit esetén ez a szám 1,35ps lenne. Ez egy teljesen lehetetlen szám, amelyet egy külön, erre kifejlesztett DAC esetében lehet csak elérni. Ez azt jelenti, hogy a túl-mintavétel elméletileg nem működhet, mert csökkenti a pontosságot. Röviden, csak az eredeti adatok túl-mintázásával a 16 bit-es pontosság már nem jön létre.
Túlmintavételezés és a high-bit. Eredetileg a túlmintavételezést nem az információ mennyiségének növelése érdekében fejlesztették ki hanem, hogy lehetővé tegye egy finomabb jellemzőkkel rendelkező analóg szűrő használatát utószűrőként. Sokan még mindig félreértik ezt. A legnépszerűbb FIR típusú digitális szűrő elve az eredeti adatok áthelyezése és átfedése, nem pedig egy további létrehozása.
Amikor az adatokat az együtthatónak az eredeti adatokhoz való szorzásával fedik le, új információk jelennek meg 16bit alatt, és ennek a finomabb információnak a helyreállításához magasabb bitsebesség-feldolgozásra van szükség. Például egy SM5842 nagy teljesítményű digitális szűrő esetében ez a feldolgozás 32 bit-ben történik, és a szűrő akár 20 bit kimenetre is kerekít, ami további hibákat okoz az újrakvantálási folyamatban. Nemrégiben ezt a problémát kezelték, és létrehoztak egy szűrőt, amely egyszerre 8x-os mintavételt képes előállítani. De még így sincs mód arra, hogy megakadályozza a hibák előfordulását. Lehet, hogy ellentétesnek hangzik, de ha figyelembe vesszük ezt a hibát, a 16bit túl-mintavétel nélkül(!) pontosabb, mint a 8x-oversampling / 20 bit!
Mi történik, ha kiiktatjuk a túlmintavételezési folyamatot? Elméletileg, a magasabb frekvenciákon a zaj végtelenül megismétlődik, és a hagyományos válasz az lenne, hogy „szörnyen fog hangzani”. Valóban? Ennek semmi köze a „Shannon-tételhez”, és nem is szándékozom ezt megkérdőjelezni. Shannon tétele az információ továbbítására egy mintavételi elméletet vesz figyelembe. Én az információ érzékeléséről beszélek. Vagyis, azt kell mondanom, hogy hallási érzékünk korlátozott és a Shannon-tétel elégedett az emberi hallásérzékelés megfigyelő rendszerével. A kijelentés inkább azok felé irányul, akik elméleteken és oszcilloszkópokon keresztül hallgatják a hangot. Egy másik gondolkodásmód szerint, még ha az emberek nem is hallják, azért a zavar, a torzítás ott van, és befolyásol. A nyolcszoros oversampling/digital-filter azonban csak a 22.05 kHz és a 330 kHz közötti frekvenciákat tudja kikapcsolni. A 330 kHz-en túli dolgok érintetlenül jönnek át, ami azt jelenti, hogy a hatás mértékét az határozza meg, hogy az említett berendezés hogyan reagál a 330 kHz-en túli összetevőkre. Szerintem, ha 100 kHz-es sávszélesség átvihető, nem lesz probléma.
A digitális szűrő problémái. A legnépszerűbb FIR típusú digitális szűrő a bemeneti adatok késleltetése után sokszoroz, és ezt a folyamatot „n” alkalommal ismétli. Az említett késedelem nem a számítási idő, hanem inkább a várakozási idő, amíg a következő adatok megérkeznek. Elég nehéz ösztönösen megérteni ezt. (5. ábra) Az adatok kiszámítása nagy teljesítményű SM5842 digitális szűrőn keresztül. Mivel a CD mintavételi frekvenciája 44,1 kHz, az 1 x mintavétel minden késleltetési ideje 22.ms. A nyolcszoros mintavétel eléréséhez az SM5842 háromszor ismétel kétszeres mintavételt, és minden lépés magában foglal 169 fokot 2 x-re, 29 fokot 4 x-re és 17 fokot 8 x-re. Az egyes lépcsők felhalmozódott késleltetése 1,92 ms, 0,16 és 0,05ms lesz: összesen 2,13 ms. Hallási érzékünk 2ms időközönként elvégzi a frekvenciaelemzést, és nagyarányú késést kaphat.
A hangnak az időtengelyen való kiterjesztését „a hang koherenciájának diffúziójaként” fejezzük ki. Például, ha egy zongorahang indulása nem elég világos – mintha a kalapácson lévő filc vastagabbá vált volna akkor hallható ez. Ezt a problémát nemcsak a lejátszási rendszerek hordozzák, figyelembe kell venni a felvételi rendszereknél is.
A Non-oversampling hangja. A „hang koherencia diffúziójának” szempontjából egy Wadia dekóder vagy a Luxman korábbi DA-07 típusú DAC egysége kiválónak tekinthető. Mindkettő kiemelkedő értékeléseket kapott a hang érzéki ábrázolásáért. Egy Non-oversampling DAC hangja elméletileg meghaladhatja ezeket az eredményeket. A Non-oversampling DAC és a hagyományos DAC közötti különbség a digitális szűrővel abban rejlik, hogy fontosságot tulajdonítunk-e az időtartomány vagy a frekvenciatartomány pontosságának, akár a zenei előadást, akár a hang minőségét választjuk. Itt a kompromisszumos határvonal, amely meghatározza a digitális audio formátum milyenségét. Természetes, stresszmentes hang, amely közvetlenül neked közvetíti a zenészek szándékát. Ez a Non-oversampling DAC hangja. Ennek a hangnak az érzése közelebb áll az analóg reprodukcióhoz.
A digitális audio-terület alapvető előnye, hogy minősége nem függ a jelet szállító formától. Ez azért van, mert a fogadó oldalon a bejövő adatokból létre kell hoznunk az időtengelyt. Ez egy olyan folyamat, amely elkerülhetetlen a formátumhoz, amely szó-szinkronizálást igényel. Gyakran félreértik, mintha az időtengely digitális lenne, nem pedig analóg, mert a mintavétel után diszkrét értéket kapni, de valójában teljesen analóg. Amikor az időtengely torzul, az analóg hullámforma torzul vele együtt.
Mi történik, ha a fogadó oldalon a saját órával olvasunk? Sajnos a szó-szinkron nem tartható meg, és a hullámforma darabokra törik. Ez gyakran előfordul a PLL óra és a nem PLL óra közötti frekvencia különbség miatt, végül is több mint 100-szorosa a 16 bites kritériumnak.
Hogy hangzik? Elviselhetetlen hallgatni? Valahogy nem, és/de rendkívül valósághű hang-mezőt hoz létre. Egy bizonyos akusztikus légkört, úgy érezni, mintha ugyanazon a színpadon lennénk az előadókkal, kommunikálva a zenészek közötti feszültségeket és feloldást. Hogy az emberi fül érzéketlen-e az idegességre? Hogy van-e feszültség érzés az nem igazán kérdés. Az igazi probléma a PLL által okozott időtengely állandó ingadozása. Ami fontos, az a megléte, nem pedig a mennyisége. Hallhatjuk a digitális jelszállítások különböző jellemzőit. Hallhatjuk a jelfeldolgozás hatását az impulzus komponens körül. Nem érhető el jó hang csak úgy, ha a torzítási tényező nullához közeli számaival versenyzünk, sem a frekvenciatartomány túlzott kiterjesztésével. A következő generációs digitális formátumban a jobb hangzás értékelhető pontjai a bit-számok és a mintavételi gyakoriságok számszerűsítése. Ez csak a torzulások csökkentését és a frekvenciatartomány kiterjesztését jelenti.
A CD megjelenése, mint új formátum az LP utóda, korszakalkotó esemény volt. A mester-szalag hangját kívánta bevarázsolni a zenehallgató szobánkba. Ez az akkori mérnökök erőfeszítéseinek kikristályosodása volt. Ehhez képest a ma kínált új generációs CD-k csak az adatsebesség növelésére vonatkoznak. A formátumok élettartama nagyon rövid lesz. Pontosan meg kell értenünk a jelenlegi formátum érdemeit és létre kell hoznunk egy újat, amely megfelel a hallási érzékelésünknek”…
Ez Ryohei Kusunoki úr háromrészes cikkének Yoshi és Irene Segoshi által szerkesztett változata, amely 1996 novemberétől 1997 decemberéig jelent meg az MJ magazinban.
Megjegyzések:
Az audiofilek végezte hallgatási tesztek visszajelzései alapján célszerű megkísérelni a jitter szintet a 0-hoz közelíteni. Az lenne a legjobb, ha nulla jittert érnénk el, mivel a nullától magasabb jitter szintek hallható „zavart” okoznak. Az alul-mintavételezés és vagy az alacsonyabb mintavételezési sebesség csökkenti a mintaidőzítési ingadozások hallhatóságát, míg a túlmintavételezés és a magasabb mintavételezési arányok növelik a mintaidőzítési ingadozások hallható hatását. Az alacsonyabb felbontással készült felvételek esetén – amelyek a lejátszási rendszer kvalitásait nem „hajtják ki” a végsőkig – előfordulhat, hogy nem fedik fel a nagyon alacsony jitter hatását, mivel a jitter által okozott torzítást elfedik. Az időzítés ingadozásai hallhatóvá válnak, meghaladják a hallhatósági küszöböt, nagyjából az 1%-ot. A legtöbb DAC-nak nem okoz problémát az alacsony torzítás (THD) fenntartása, amely sokkal alacsonyabb, mint a mintaidő-ingadozások hallható hatása.
A jitter kezelésének, mivel a legnagyobb hallható torzítást okozza, mindig a legmagasabb prioritást kell kapnia. Rendkívül nehéz minimalizálni az A/D és D/A konverziós jitter által okozott hallható károsodást egy olyan DAC-ban, amely a legkevésbé érzékeny a jitter-re. A 44.1/16 NOS használatával két előnyünk van. Először a magasabb mintavételi tényező (44,1 kHz) az adott A/D konverziós jitter hatását csökkenti. Másodszor, a lehető legalacsonyabb mintavételezéssel, a mintavétel időtartamának maximalizálásával, az adott lejátszási óra jitter-hatása is csökken. Gyakorlati hallgatási körülmények között a felbontás érzékelése korlátozott, például a környezeti zaj, a helyiség akusztikája és a hangerő beállítása miatt. Gyakorlati körülmények között nem hallható a 16 bites felbontás, a gyakorlatban inkább a 8-10 bit hallható. (ki lehet próbálni) Az embernek egy visszhangos kamrában kellene mintákat hallgatnia, hogy esetleg néhány bit különbséget halljon. A saját szívverés, a véráramlás és a légzés belső hallása elfedi a 16 bit-es rendszer LSB-jeit. Lehetséges, hogy valaki ilyen körülmények között 12…14 bit-et meg tud hallani. Ilyen kamrában zenét hallgatni nem kellemes, így ez nem megoldás a kis-számú bitek érzékelésére. A nagy hangerőn történő zenehallgatás szintén nem praktikus.
A MasterClock jitter amplitúdója és spektruma könnyen megváltoztathatja az észlelt hangot, azonban a hang változása nem mindig jelent előrelépést. A jitter hatása nagyon félrevezető lehet. Ha a TDA1541A DEM órajel-frekvenciája 200 kHz körül van (tipikus), az aktív osztó-csatolásnak meg kell felelnie az RF szétválasztás követelményeinek. Ez megköveteli a szórt induktivitás minimalizálását. Ez a lehető legrövidebb, megfelelő vastagságú jel-pálya (a nyomtatott áramköri lapokon) és kis méretű, lehető legkisebb szórt induktivitású alkatrészek használatával érhető el. Mindezeken felül a leválasztó alkatrészeknek a lehető legalacsonyabb egyenáramú szivárgási árammal kell rendelkezniük, és nem szenvedhetnek piezoelektromos hatásoktól.
Az alacsony szintű, de hallható torzítás egy nem megfelelően működő DEM áramkör eredménye. Az órajel frekvenciája ezt nem befolyásolja. A DEM órajel-forrás közvetlen hatással van az I2S jelekkel való áthallásra. A hangspektrumon belüli DEM órajelek üresjárati hangként válnak hallhatóvá, ez is bizonyítja az áthallás problémáját. Bizonyos mennyiségű jitter mindig „átszivárog” egy (szinkron) reclocking-körön. Ez alapvetően azt jelenti, hogy nem lehet teljesen eltávolítani a jittert a forrásból a kimenő jelek „újra-órázásával”. A „tiszta forrás koncepció”, ahol nem kell blokkolni a forrás jittert, és így kiküszöbölni a reclocking-al kapcsolatos összes problémát, elfeledteti a külső DAC-okkal kapcsolatos jitter-problémát is.