A motyogás nem a lustaság jele – ez egy okos adattömörítési trükk

Everett Collection via

Sokunknak azt tanították, hogy a magánhangzók éles kiejtése és a mássalhangzók elhagyása a hanyag beszéd tünetei, ha nem egyenesen az angol nyelv semmibe vételének jele. Az ír drámaíró, St. John Ervine úgy tekintett az ilyen szokásokra, mint annak bizonyítékára, hogy egyes beszélők “gyengék, túlságosan lanyhák és elkényelmesedettek ahhoz, hogy nemes nyelvüket bármilyen erővel beszéljék”. Ha ez így van, akkor a nyelvi puhányság tengerében úszunk; Keith Johnson megállapította, hogy a beszélők a társalgásban elhangzó szavak több mint 60 százalékában lazítottak vagy hagytak el hangokat. Szerencsére a motyogás tudománya egy sokkal kevésbé ítélkező – és sokkal lebilincselőbb – beszámolót kínál tökéletlenül éles kiejtésünkről.

A hangok elhagyása vagy csökkentése távolról sem a nyelvi közömbösség vagy erkölcsi hanyatlás tünete, hanem az MP3 és JPEG fájlok létrehozásához használt adattömörítési sémákhoz hasonló logikát mutat. Ezek az algoritmusok úgy csökkentik a hangok és képek digitális tárolásához szükséges helyet, hogy kidobják a felesleges vagy az érzékelésünkhöz nem sokat hozzáadó információkat – például kidobják a nem hallható hangfrekvenciájú adatokat, vagy nem vesződnek azzal, hogy a nehezen észrevehető színek enyhe árnyalatait kódolják. Az ötlet lényege, hogy csak a legnagyobb hatású információt tartsuk meg.

Úgy tűnik, hogy a motyogás – vagy ahogy a nyelvtudósok nevezik, a fonetikai redukció – hasonló stratégiát követ. Nem minden szó egyforma valószínűséggel redukálódik. A beszédben nagyobb valószínűséggel redukálódnak az olyan gyakori szavak, mint a fine, mint az olyan szokatlan szavak, mint a tine. Szintén nagyobb valószínűséggel redukáljuk a szavakat, ha azok a szövegkörnyezetben kiszámíthatóak, így a fine szót kevésbé határozottan ejtjük ki egy olyan mondatban, mint a “You’re going to be just fine”, mint a “The last word in this sentence is fine”. Ez arra utal, hogy a beszélők pusztán tudattalan szinten stratégiailag megőrzik az információt, ha szükség van rá, de gyakran elhagyják, ha az nem nyújt nagy kommunikációs hasznot. A beszéd fáradságos, kognitívan költséges tevékenység, és azáltal, hogy ott racionalizálnak, ahol tudnak, a beszélők végső soron jobban megtervezett, folyékonyabb mondatokat produkálhatnak.

Ez a fajta nyelvi adattömörítés nem korlátozódik a kiejtésre: Arra vonatkozó döntéseket is vezérli, hogy bizonyos szavakat kimondjunk vagy kihagyjunk. Sokkal nagyobb valószínűséggel adja meg, hogy a szomszédja női rendőr vagy férfi ápoló, mintha a nemek felcserélődnének. Mivel történelmileg a legtöbb rendőr férfi, a legtöbb ápoló pedig nő, a nem a szokásos esetben meglehetősen kiszámítható; az értékes kognitív energiát az anomális esetekre tartogatjuk, amikor a férfi és a nő szavak hasznosabbak.

A hangok elhagyása vagy csökkentése távolról sem a nyelvi közöny vagy az erkölcsi hanyatlás tünete, hanem az MP3-ak és JPEG-ek létrehozásához használt adattömörítési sémákhoz hasonló logikát mutat.

A stratégiai lustaság fogalma, amelyben az erőfeszítés és az információs érték megfontoltan egyensúlyban van egymással, az egyes beszélőkön túl egész nyelvekre is kiterjed, és segít megmagyarázni, hogy miért rendelkeznek bizonyos tulajdonságokkal. Például némi betekintést nyújt abba, hogy a nyelvek miért tűrik meg a szókincsükben a nagy mennyiségű kétértelműséget: A beszélők képesek a könnyen kiejthető szavakat és kifejezéseket újrahasznosítani, hogy többféle jelentést vegyenek fel, olyan helyzetekben, amikor a hallgató könnyen vissza tudja fejteni a beszélő szándékát. Arra is hivatkoztak már, hogy megmagyarázza azt a tényt, hogy a nyelvek között a leggyakoribb szavak általában rövidek, minimális mennyiségű hangtani információt hordoznak, és hogy megmagyarázza, hogy a nyelvek miért fogadnak el bizonyos szórendeket.

A stratégiai adattömörítést működés közben is láthatjuk, ha megvizsgáljuk a nyelvek színszókincsét. Egyes nyelvek mindössze három vagy négy különböző szóval is beérik a színekre; például a lele nyelv, amelyet több tízezer ember beszél Csádban, egyetlen szót használ a sárga, a zöld és a kék színekre. A minimalista színszókészlettel rendelkező nyelveket általában az iparosodás előtti társadalmakban beszélik, ahol nagyon kevés olyan tárgy van, amelyre mesterségesen színt alkalmaztak. Ez azt jelenti, hogy a beszélők többnyire természetes tárgyakra hivatkoznak, amelyek esetében a szín nagyon is kiszámítható, ahogyan hagyományosan a nem az ápolónők vagy a rendőrök esetében is. Ha visszagondolunk arra, amikor utoljára megkértünk valakit, hogy menjen ki és vágja le a zöld füvet, vagy vegyen neked sárga banánt, akkor könnyebben megértjük, hogyan boldogulhat egy nyelv a színszavak bőséges menüje nélkül – különösen egy olyan területen, ahol nincsenek bőséges fogyasztási cikkek.

Míg sok okunk van azt hinni, hogy a nyelv nagyfokú adattömörítéssel jár a jelentés katasztrofális elvesztése nélkül, a tudósok még mindig nagyon keveset tudnak arról, hogy a beszélők hogyan találják ki, pontosan milyen információt engedhetik meg maguknak, hogy elhagyják, és mikor. Az MP3-fájlok létrehozásához használt adattömörítési algoritmusok számos pszichoakusztikai kísérleten alapulnak, amelyek az emberi hallásérzékelés finomságait vizsgálták. Vannak-e a hangszóróknak implicit elméleteik arról, hogy milyen információk a legfontosabbak a hallgatóik számára? Ha igen, hogyan néznek ki ezek az elméletek, és hogyan jutnak rájuk a beszélők? És mit lehet kezdeni azzal a ténnyel, hogy az emberek néha érthetetlenül motyognak, vagy túl sok, vagy rossz információt adnak ki? (Lásd még Aatish Bhatia korábbi bejegyzését: “The Math Trick Behind MP3s, JPEGs, and Homer Simpson’s Face”).

Azt sem tudjuk, hogy a hangszórók mennyire jól hangolják adattömörítési algoritmusaikat az egyes hallgatók igényeihez. Ahhoz, hogy pontosan megjósoljuk, hogy egy hallgató milyen információkat tud könnyen visszanyerni, néha sokat kell tudni a korábbi tapasztalatairól vagy ismereteiről. Végül is, az egyik ember redundanciája lehet a másik ember anomáliája, amint azt egy olyan beszélgetés is világossá tette, amelyet egyszer egy repülőgépen utazó társammal folytattam. Éppen Calgary városából indultunk, a kanadai Sziklás-hegység mellett. Társam, aki hazafelé tartott Floridába, elmesélte, hogy remekül nyaralt a családjával, több napot töltöttek a hegyekben havas síeléssel. Az én kanadai fülemnek ez furcsán hangzott – a síelés általában nem havazással jár? Megkérdeztem, hogy használja-e valaha is csak a síelés kifejezést. Nos igen, magyarázta türelmesen. De akkor az a vízen lenne.

Julie Sedivy nyelvészetet és pszichológiát tanít a Calgary Egyetemen, és a Twitteren @soldonlanguage.

cserélget információkat.

Vélemény, hozzászólás?

Az e-mail-címet nem tesszük közzé.