Miért számít a hang? Mindenféle hang vesz körül bennünket egész nap folyamatosan, és amint azt számos tanulmány kimutatta, minden hang hatással van egészségünkre és hangulatunkra. A hangokat az emberi kommunikációban és a szórakozásban is alkalmazzuk, de jelentősége ennél sokkal több. A hang érzékszervi értékelése a hang megértésével kezdődik, beleértve az emberi hallást, a pszichoakusztikát, a térbeli hallást, a zene és a beszéd emberi észlelését, valamint a halláskárosodást. Az elmúlt évtizedekben az emberi hangérzékelés mögötti mechanizmusokat nagymértékben kutatták. A pszichoakusztika, a legalapvetőbb szinten meghatározva, a következő területekkel foglalkozik: agyunk hogyan érzékeli a hangot, a hangok hallásának módját, beleértve a frekvenciát, a hangnyomásszintet, a szubjektív hallási változókat és a fül anatómiáját. Mindezeket különböző tényezők befolyásolják.
Ezeken a változókon kívül számos olyan jelenség létezik, amelyeket egy kicsit nehezebb mérni, mint például a hangmagasság, az észlelt hangerő, a hang kellemessége és mások. A hangosság, az élesség és a tonalitás jelzi, hogyan érzékeljük a hangokat. Ezek a tényezők a hang tulajdonságát jelentik. Az emberek nemcsak az egyik tényezőt hallják, hanem egyszerre hallják az összeset. Ezek kombinálásával világos illusztrációt kaphatunk arról, hogy egy személy hogyan hallja a hangot. A következők tanulmányozását azért tartjuk fontosnak, mert mivel mindannyian szeretünk zenét hallgatni, a tudomány segít megérteni a hallás mechanizmusát.
A hallás anatómiájának alapjai. A fülnek három része van, ezek a következők: a külső fül, a középfül és a belső fül. A külső fül a pinna (auricle) és a fülcsatorna együttese. A pinna a fül látható külső része, amely tipikusan a fülszerkezethez kapcsolódik. Ezenkívül a fej és a vállak szintén a külső fül részének tekinthetők, mert szerepük van az észlelésben. A középfül a dobhártyából és három különálló csontból, valamint a köztük lévő terekből áll. Végül a belső fül a cochlea összessége, ami négy struktúrából áll: a basilaris membránból, a tektorális membránból, a külső szőrsejtekből és a belső szőrsejtekből.
A külső fül-struktúrák legkiemelkedőbb funkciója a fejhez kapcsolódik. A külső fül-struktúrák a testet, a fejet és a fülkagylót használják, hogy információt adjanak az agynak az irányról, ahonnan a hang érkezik. Ezen információk értelmezésének másik módja a fejjel kapcsolatos impulzusválaszok, amelyek egyenértékű információt közvetítenek az idő tartományában. A fülön keresztül érkező két hangbemenetet vizsgálva felmerül a kérdés, hogy az agy hogyan képes binaurális hallással felismerni az irányt, mert lehetővé teszik számunkra, hogy különbséget tegyünk felfelé és lefelé, előre és hátulra, valamint más irányokra. Ezenkívül a hallójárat rezonancia tartománya valahol 1 és 4 kHz között van, ami azt jelenti, hogy a fül érzékenysége ebben a hang-tartományban van.
A középfül elsődleges funkciója, a 700 Hz körüli hang-tartományhoz, „felüláteresztő” szűrőként szolgál. Ezenkívül a középfül mechanikus transzformátorként működik. Az izomaktivitás befolyásolhatja a középfület – a középfülben lévő három csont közötti tér megváltozása miatt. Bizonyos szélsőséges esetekben a középfül védelmet nyújthat a fülsiketítő hangok ellen.
A belső fül. A hallott hang nagy része a belső fülben lévő agyi információvá (neurális információként ismert) alakul át. A belső fül fizikai szűrőként is viselkedik – a hangok áthaladnak a cochleán, és magas a hangokról alacsonyra szűrődnek, ahogyan tovább haladnak a cochleában. Ez két felüláteresztő szűrő kapcsolt hangolásának köszönhető, amelyek belső szőrsejtekkel vannak összekapcsolva, ezek detektorként viselkednek és megkülönböztetik a két felüláteresztő szűrőt.
A belső szőrsejtek alján kalcium csatornák vannak, amelyek a szőrsejtek mozgásával nyílnak és záródnak. A kalcium csatornák nagyon érzékenyek. A legkisebb mozgás is elegendő a belső szőrsejtek aktiválásához. A belső szőrsejtek alacsonyabb frekvenciákon (500 Hz és alatta) érzékelik a hullámforma elülső élét. Magasabb frekvenciákon azonban a belső szőrsejtek jobban érzékelik a burok felső élét, és ez a 2000 Hz feletti frekvenciákon történik. A jelenség vegyesebb az 500 Hz és 2000 Hz közötti frekvenciákon. Ahogy a basilaris membrán mozgási szintje növekszik, annál több idegsejt aktiválódik. Magas hangfrekvenciákon a basilar membrán első szakasza 15 000 – 16 000 Hz feletti érzékelési képességgel rendelkezik. Bár egyes személyek figyelemre méltó hallásképességet mutattak (akár 20 000 Hz-ig), a basilaris membrán első szakaszáról ismert, hogy a környezeti hatások és az idő múlása károsítják.
A hallás a hangmagasság különböző szintjein szubjektív és egyénenként változó. A hallott hang minősége korrelál a hang tiszta frekvenciájával. A nagy frekvencia számú hangokat általában magas hangmagasságúnak, míg a számszakilag kevesebb frekvenciájú hangokat alacsony hangmagasságúnak minősítjük. A kapcsolat a hangmagasság és a frekvencia között azonban nem lineáris! A kettő közötti különbség vizsgálatára a hangmagasság fogalmának kezelésére a „mel” nevű egységet jelölték ki. Például egy 1000 Hz-es hang 1000 mel-nek felel meg feltéve, hogy a hang 40 dB SPL hangnyomáson érkezik. A hangosság fogalma a hangnyomás-szinthez (SPL) kapcsolódik. Ezenkívül a hangosság attól függ, hogy mennyi ideig tart a hang és annak frekvencia tartalma az impulzus csúcsának függvényében. Az SPL és a hang hangereje összefüggést alkot – és közelíthető a Steven hatványtörvénye néven ismert matematikai képlettel – amely előírja, hogy az SPL exponense 0,67.
A lokalizáció az a képesség, hogy egy személy hogyan képes irányban és távolságban megtalálni és azonosítani az észlelt hang helyét vagy eredetét. Az emberi hangérzékelés különféle stimulánsokat használ a hangok eredetének meghatározására. Ezek közé tartozik a belső fülben található struktúrák közötti időbeli és intenzitásbeli változások, amint azt fentebb említettük. A hang megkülönböztetés azt jelenti, hogy képesek vagyunk azonosítani és megkülönböztetni a különböző hangok közötti hasonlóságokat és különbségeket. Pontosabban, ez a képesség lehetővé teszi az egyének számára, hogy észrevegyék az egyes beszélt szavak közötti apró különbségeket. Ha a különbség kicsi, azok számára akkor is érzékelhető, akik képesek megkülönböztetni ezeknek a hanghullámoknak kicsiny különbségeit.
Egy tanulmányban, amely az akusztikus változási komplexum (más néven ACC) és a hang megkülönböztetés hasonló mérései közötti kapcsolatot vizsgálta, azt találták, hogy …„a frekvencia és intenzitás megkülönböztetésének elektrofiziológiai és pszichofizikai mérései szignifikánsan korrelálnak”… Ez azt jelzi, hogy az akusztikai változási komplexum a hangintenzitás és a frekvencia hangmegkülönböztetésének teljesebb mutatójaként használható. Sőt, az akusztikus változás komplex amplitúdója jobban szolgálhat a hangszámítás mutatójaként, mint az akusztikus változás komplex késleltetése.
Az észlelési képesség és az anatómia közötti kapcsolat, a hang-intenzitással és a hangerő közötti különbségekkel magyarázható. Bár ez a két kifejezés felcserélhetőnek tűnhet, a kettő között meglehetősen nagy különbség van. A hangintenzitás a regisztrált tényleges hangnyomás-szinthez kapcsolódik. A fülünk által hallható hangoknak, a hang frekvenciája szempontjából van egy határa. A hallható tartomány 20 Hz és 20 000 Hertz (Hz) között van. Ezenkívül a hangok attól függően változhatnak, hogy mennyire hangosak. Ezt decibelben (dB) mérik. E két mutató használatával fizikailag mérhető a hang tényleges hangintenzitása. A hang nyomon követésére használt két mérőszám a hangérzékelés tartomány szintje és a hangérzékelés hangerejének értéke. Nyilvánvaló, hogy a külső fülön keresztül belépő hang nem azonos a belső fülön áthaladó hanggal. Valójában a belső fül csökkenti a hangot – amely végül a dobhártyáig folytatódik – az eredeti töredékére. A hallóideg mindezt érzékeli és továbbítja a jelet az agyba.
A központi idegrendszernek fontos szerepe van a fülünkbe jutó hangok megfejtésében. Legtöbbször felesleges zaj van, amit ki kell szűrni. Például egy zsúfolt étteremben zajló normális hangerejű beszélgetésnek ki kell használnia ezt a képességet, hogy leküzdje a sok irreleváns hang beáramlását. Valójában a központi idegrendszer úgy fejlődött, hogy kiszűrje a fontos hang információkat a környezetből és azokat egy végső eredménnyé dolgozza fel.
Az audio-periféria átviteli funkcióján keresztül tájékoztatja az agyat az irányról. Ezután a cochlea frekvencia-idő elemzést végez. Ezt az elemzést a hanghullám-tömörítés egyik formájával hangossággá alakítja át. A halló periféria elemzi az összes hangjelet egy idő/frekvencia intervallumban, amelyet „ERB-nek” neveznek. Ezenkívül a cochlea mechanikája lehetővé teszi, hogy a kezdeti hanghullámok figyelemre méltó hatást gyakoroljanak a ténylegesen hallottakra. Ennek hasznos hatása lehet az emberiség fejlődése során.
A részleges hangosság rövid távú legfeljebb 200 ms. A hangosság apró változásainak észlelési képessége elsősorban korrelál azzal, hogy milyen hosszú ez az időszak. Például a Level Roving kísérletek azt mutatják, hogy ha több mint 200 ms késleltetés van egynél több különálló hangforrás között, nehezebb felismerni a hangerő változásait. Auditív tárgyak kialakulását az agyunkban a tudósok úgy definiálják, mint „különálló hangok sorozatai vagy folyamatos hangok részei”. Ezeket a hangokat együtt tapasztaljuk, így folyamatos hallási élményünk van. A hallottak hosszú távú emlékekké alakíthatók. Természetesen a részletek hatalmas mértékét nem fogja teljesen „menteni” az agy, (nem vagyunk számítógép), más szavakkal, jelentősen csökken a hallás adatfeldolgozási sebessége. Ezenkívül más tényezők – például a megismerés és a figyelem a feldolgozás idején – meghatározzák, hogy a hang mennyire integrálódik a hosszú távú memóriába.
A hangfeldolgozás sebessége. A fülhöz eljutó hang és az agy között az audio adatok másodpercenként megabit sebességgel haladnak, ami másodpercenként 1 millió bájt. A hangosság meghatározása után elemzés történik, és ennek a folyamatnak a sebessége is megabit/másodperc. A hallási objektumok elemzésével azonban az adatátviteli sebesség másodpercenként már kilobyte-ra csökken, ami másodpercenként mindössze ezer bájt. A helyzetet tovább rontja, hogy amikor a hallási objektumok adatait hosszú távú memóriába dolgozzuk fel, az adatátviteli sebesség csak bájt/másodperc. A hang adatátviteli sebességének súlyos csökkenése, a mindennapi hallásra, bizonyos következményekkel jár. Az egyik ilyen következmény az, hogy az emberek, legalábbis részben, felelősek azért a hangért, amely a hosszú távú memóriájukban megmarad. Ez függetlenül attól megtörténik, hogy szándékos-e vagy sem. Ezenkívül nemcsak az audio-adatokat használjuk a memóriánkba történő integrálásra. Valójában minden érzékszervünket arra használjuk, hogy beépítsük az adatokat az agy számára. Úgy tűnik, hogy ez egy olyan tulajdonság, amelyet az evolúció több millió éve épített be az emberi testbe, így öntudatlanul történik.
A pszichoakusztika fontos az audiológia területén, elsősorban a zenészekre és a hangtechnikai fejlesztőkre gyakorolt hatásai miatt, de a területen lévő számos más személy, például a zenehallgatók, számára is. A pszichoakusztika kutatása csak több információt tár fel az emberi testről és hallásáról. Mint korábban említettük, a fül különböző részei (külső, középső és belső fül) hozzájárulnak ahhoz, hogy a hallóideg hogyan dolgozza fel a hangot. A hallott hangok ezután hosszú távú memóriává alakulnak az agyunkban. Az adatátviteli sebesség, amellyel az adatok konvertálódnak, változó, ezért az információ egy része elvész a külső fülből a hallóidegbe bejárt úton.
– folytatjuk –