A DSP (Digital Signal Processing), az audio-jelek digitális feldolgozása. Ha digitális hanganyagot akarunk használni, akkor a zenei jel természetes analóg formájából át kell térnünk a digitális minták formájába. A nehéz problémák egyszerű megoldása, azonban audiofil körökben gyakran vita tárgya. A DSP audio-berendezésekben való használatának megvannak az ellenfelei. A DSP viszonylag egyszerű magyarázata egy bizonyos nézőpontot igényel miszerint: a DSP akkor szükséges, ha egy digitális formátumban meglévő anyagot használunk, alakítunk, de a DSP jelfeldolgozás másik célja az is, hogy megszabaduljunk azoktól a kedvezőtlen hatásoktól, amelyek digitalizáláskor adódnak. A helyzet az, hogy e drasztikus változás után komoly „takarítást” kell végezni, vagy képletesen szólva „eloltani a tüzet”, amely a digitális mintavételezésből származó „fekete lyukakat” égette az érintetlenül sima analóg jel feldolgozása során. Például: CD-formátum kreálása esetén, amit folyamatos analóg jelből állítanak elő, a digitális audio mintákhoz a 65 000 feszültségszint egyike van hozzárendelve (kvantálás), másodpercenként 44 100 minta sűrűséggel.
A magas hangok karakterisztikájában (15 kHz felett csökkenés) 4-szeres túl-mintavétel után, 22 kHz felett többszörös tükörkép látható
A lejátszási folyamat végén a hangjelnek „ismét folyamatossá kell válnia”, legalább is így kell hallanunk, mert a hallásunk analóg. Ezért nagyon ügyesen kell kitölteni a digitális minták közötti „lyukakat”. Sőt, ügyelni kell arra is, hogy az eredeti minták a kimeneten továbbra is a legkevésbé megváltozott értéket tartsák meg, mert az sajnos biztos, hogy a végső D/A konvertálás után eltérések lesznek az eredeti anyagtól.
Hogy jobban illusztráljuk a problémát, amellyel ennek a „tűzoltó” DSP-nek szembe kell néznie, nézzük meg a folyamatos hullám DAC kimenetre történő reprodukálásának problémáit! A CD-n a 44,1 kHz-es frekvencián megjelenített audio-jel egymást követő valós értékei közötti állandó érték az ún. mintavételezési módszer. Az egyszerű megközelítés nem vezet kellően jó eredményre. A jelenleg jellemző eljárás a túlmintavételezés (az upsampling), vagyis egy meglehetősen agresszív DSP művelet, amelynek célja és hatása a frekvencia jel mintavételezésének növelése. Nagyon titokzatosan hangozik, hogy egy DSP „varázsló” képes a 44,1 kHz-es jelet 176,4 kHz-es anyaggá alakítani? Igen és nem is. Igen, lesz 4-szer nagyobb mintavételezési frekvenciájú anyagunk, de a hasznos információ továbbra is ugyanaz lesz, mint volt, azaz 22,05 kHz-re korlátozódik, és általában még egy kicsit kevesebb is, a felvételi oldalon található élsimító szűrők miatt. Ráadásul 22 kHz felett erős parazita interferencia lép fel. Egyszerűen fogalmazva: az eredeti 22 kHz feletti frekvenciákra átvitt frekvencia információ megkettőzése vagy tükörképe.
Ez annak a következménye, hogy egy elég drasztikus művelettel szorzott mintavételi frekvenciát kapunk, megfelelő számú egyszerű nulla beszúrásával a következő valós jelminták közé. Ezeket a torzításokat el kell távolítani, különben átkerülnek a hallható sávba. Itt merül fel az igény egy „tűzoltó” DPS elhelyezésére a jelútban, egy speciális túlmintavételező szűrő formájában. A DAC integrált áramkörében a túlmintavételezéses szűrést általában digitális, aluláteresztő, lineáris fázisú, szimmetrikus impulzusválaszú szűrőként (ún. FIR szűrőként) valósítják meg. Ez a DSP lényege. És itt merül fel egy potenciális probléma. Ez egy „technikai módszer”, azaz csak egy tartományra – frekvenciára – optimalizált FIR szűrők használatára vonatkozik, miközben a kutatások jól dokumentálták az időtartomány (impulzusválasz) fontosságát.
Az aluláteresztő túlmintavételező szűrő frekvenciaválaszának szuperponálása 4-szeres túlmintavételezés után. Megjegyzés: az Y tengely léptékét megnyújtották, hogy a szűrő karakterisztikájához „illeszkedjen”, így a karakterisztika „ellapul”.
A Heisenberg-Gabor matematikai elmélet, azt állítja, hogy nem lehet egyszerre optimalizálni az idő- és frekvenciatartományban. A digitális technológia gyors fejlődése ellenére nehéz megbirkózni ezekkel a korlátokkal. A 2. ábrán bemutatott, D/A konverterekben használt FIR szűrőket a frekvenciatartományban meglehetősen precíz szűrés jellemzi (éles ferde szűrő lejtések) az időtartomány megnövekedett hullámosságának rovására. A valóságban nincs ingyen ebéd, és ez és talán különösen vonatkozik az „audiofil menüre” is. A mi szempontunkból fontos kérdés, hogy a gyakorlatban hogyan hallható a „tűzoltó” túlmintavételező szűrőit jellemző gyenge időtartomány-paraméterek hatása. Érdekes analógiák találhatók ehhez a kérdéshez például egy széleskörű hallgatási tapasztalattal rendelkező személy Art Dudley, a „Stereophile” magazin főszerkesztőjének véleményében. Egyrészt a frekvenciamenetből adódó paraméterek túlzott, egyoldalú figyelését jelzi; másrészt alábecsültnek sorolja a hang azon fontos tulajdonságait, amelyekért az időbeli jelenségek a felelősek. Közülük a legfontosabb a hang dinamikája, hatása és kézzelfoghatósága.
Ha az időbeli jelenségek, különösen a túlmintavételezési szűrők hatása ennyire fontosak a hangzásban, természetes kétség merül fel, hogy ez a probléma eddig teljesen észrevétlen maradhatott-e? Bár jelentősége még mindig nem tükröződik megfelelően, az elmúlt években egyre inkább elismertté vált. A 2009-2010 években meglehetősen hangos viták folytak az apodizáló szűrőkről, amelyeket a Meridian márkájú termékekben és az Ayre CD-lejátszókban vezettek be. Az alkalmazott megoldás a túlmintavételezési (upsampling) szűrő egy speciális megvalósításán alapul, amely magában foglalja a szűrő-impulzus fő csúcsa mögötti időtartomány teljes hullámainak átvitelét. Ily módon a klasszikus FIR szűrők által a DAC-ban jelentkező különösen kedvezőtlen jelenség, az „alaphang” megjelenését megelőző időtartományban az ún. előcsengetés (pre-response) lett.
A klasszikus, szimmetrikus FIR szűrő (kék) összehasonlítása az ún. MP szűrővel (Minimum-Phase, piros), amelyben az összes hullám a fő impulzus után jelenik meg. A következő jelminta az időtengelyen, Y-tengely: a relatív skála amplitúdó megfelel az ábrázolt szűrő frekvenciaválaszának.
Ez a jelenség a hallás szempontjából különösen problematikus, mert a zenei jel valóságában nem fordul elő, így az emberi fül nagyon érzékeny rá, teljesen mesterségesnek érzékeli. A fő impulzus után fellépő hullámok azonban még akkor is, ha túl hosszúak, torzak stb., egy egészen természetes hang részei lehetnek. A cikkünk a túl-mintavételezéssel kapcsolatos, de a „tűzoltó” DSP funkció nem meríti ki a teljes rendszer időparamétereinek (vagy frekvenciaválaszának) optimalizálásának problémáját, mivel az időtartományban a torzításokat a teljesen analóg is bevezeti. Az idő szempontjainak további optimalizálása DSP „erősítők” használatával lehetséges a viszonylag új audio-technológiák dinamikusan fejlődő területén.