Mompelen is geen teken van luiheid, maar een slimme data-compressietruc

Velen van ons hebben geleerd dat het onduidelijk uitspreken van klinkers en het laten vallen van medeklinkers symptomen zijn van slordig taalgebruik, zo niet regelrechte minachting voor de Engelse taal. De Ierse toneelschrijver St. John Ervine beschouwde dergelijke gewoonten als bewijs dat sommige sprekers “zwakkelingen zijn die te loom en te verzwakt zijn om hun nobele taal met enige kracht te spreken”. Als dat zo is, dan zwemmen we in een zee van linguïstische slapheid; Keith Johnson ontdekte dat sprekers in meer dan 60 procent van de in een gesprek gesproken woorden de klanken versoepelden of lieten vallen. Gelukkig biedt de wetenschap van het mompelen een veel minder veroordelend – en meer boeiend – verslag van onze onvolmaakt scherpe uitspraken.

Verre van een symptoom van linguïstische onverschilligheid of moreel verval te zijn, vertoont het laten vallen of verminderen van klanken een onderliggende logica die vergelijkbaar is met de data-compressie schema’s die worden gebruikt om MP3’s en JPEG’s te maken. Deze algoritmen reduceren de ruimte die nodig is om geluiden en beelden digitaal op te slaan door informatie weg te gooien die overbodig is of niet veel toevoegt aan onze perceptuele ervaring – bijvoorbeeld door gegevens weg te gooien bij geluidsfrequenties die we niet kunnen horen, of door niet de moeite te nemen om kleine kleurgradaties te coderen die moeilijk te zien zijn. Het idee is om alleen de informatie te behouden die de grootste impact heeft.

Mompelen – of fonetische reductie, zoals taalwetenschappers het liever noemen – lijkt een soortgelijke strategie te volgen. Niet alle woorden hebben evenveel kans om gereduceerd te worden. In spraak worden gewone woorden zoals fine eerder gereduceerd dan ongewone woorden zoals tine. Je zult woorden ook eerder reduceren als ze voorspelbaar zijn in de context, zodat het woord fijn minder uitgesproken zal worden in een zin als “Het komt wel goed met je” dan “Het laatste woord in deze zin is fijn”. Dit suggereert dat sprekers, op een puur onbewust niveau, informatie strategisch bewaren als het nodig is, maar het vaak weglaten als het communicatief niet veel oplevert. Spreken is een inspannende, cognitief dure activiteit, en door te stroomlijnen waar ze kunnen, kunnen sprekers uiteindelijk beter ontworpen, vloeiendere zinnen produceren.

Dit soort linguïstische gegevenscompressie is niet beperkt tot de uitspraak: Het stuurt ook beslissingen over het al dan niet uitspreken of weglaten van bepaalde woorden. Je hebt veel meer kans om te zeggen dat je buurman een vrouwelijke politieagent of een mannelijke verpleegster is dan wanneer de geslachten waren omgedraaid. Aangezien de meeste politieagenten mannen zijn en de meeste verpleegsters historisch gezien vrouwen, is het geslacht in het gebruikelijke geval vrij voorspelbaar; kostbare cognitieve energie wordt gereserveerd voor de afwijkende gevallen, waarin de woorden man en vrouw nuttiger zijn.

Verre van een symptoom van linguïstische onverschilligheid of moreel verval te zijn, vertoont het weglaten of verminderen van geluiden een onderliggende logica die vergelijkbaar is met de data-compressieschema’s die worden gebruikt om MP3’s en JPEG’s te maken.

De notie van strategische luiheid, waarbij inspanning en informatiewaarde oordeelkundig tegen elkaar worden afgewogen, schaalt op van individuele sprekers tot hele talen, en helpt te verklaren waarom zij bepaalde eigenschappen hebben. Het biedt bijvoorbeeld enig inzicht in waarom talen enorme hoeveelheden ambiguïteit in hun vocabulaire tolereren: Sprekers kunnen gemakkelijk uit te spreken woorden en zinnen hergebruiken om er meerdere betekenissen aan te geven, in situaties waarin luisteraars gemakkelijk kunnen achterhalen wat de bedoeling van de spreker was. Het is ook aangevoerd als verklaring voor het feit dat in alle talen de meest voorkomende woorden meestal kort zijn, met een minimale hoeveelheid fonetische informatie, en als verklaring voor het feit dat talen bepaalde woordvolgordes hanteren.

U kunt strategische gegevenscompressie ook in actie zien door kleurwoordenlijsten in verschillende talen te inspecteren. Sommige talen hebben genoeg aan slechts drie of vier verschillende woorden voor kleur. De taal van de Lele bijvoorbeeld, die door tienduizenden mensen in Tsjaad wordt gesproken, gebruikt één woord voor geel, groen en blauw. Talen met een minimalistische kleurenwoordenschat worden meestal gesproken in pre-industriële samenlevingen, waar zeer weinig kunstmatig vervaardigde voorwerpen een kleur hebben gekregen. Dit betekent dat sprekers meestal verwijzen naar natuurlijke voorwerpen, waarvoor kleur zeer voorspelbaar is, net zoals geslacht traditioneel is voor verpleegsters of politieagenten. Als u terugdenkt aan de laatste keer dat u iemand vroeg om het groene gras te gaan maaien of om gele bananen voor u te kopen, wordt het gemakkelijker om te zien hoe een taal zich zou kunnen redden zonder een overvloedig menu van kleurwoorden – vooral in een gebied zonder een overvloed aan consumptieartikelen.

Hoewel er veel redenen zijn om aan te nemen dat taal een grote mate van datacompressie inhoudt zonder catastrofaal verlies van betekenis, weten wetenschappers nog steeds heel weinig over hoe sprekers precies uitvinden welke informatie ze zich kunnen veroorloven weg te laten en wanneer. De algoritmen voor gegevenscompressie die worden gebruikt om MP3-bestanden te maken, zijn gebaseerd op een groot aantal psychoakoestische experimenten die de fijne kneepjes van de menselijke auditieve waarneming onderzochten. Hebben sprekers impliciete theorieën over welke informatie het meest essentieel is voor hun luisteraars? Zo ja, hoe zien die theorieën er dan uit, en hoe komen sprekers tot die theorieën? En wat te denken van het feit dat mensen soms onverstaanbaar mompelen, waarbij ze ofwel te veel informatie, ofwel de verkeerde informatie naar buiten brengen? (Zie ook Aatish Bhatia’s eerdere post, “The Math Trick Behind MP3s, JPEGs, and Homer Simpson’s Face.”)

We weten ook niet hoe goed luidsprekers hun data-compressie algoritmen afstemmen op de behoeften van individuele luisteraars. Het nauwkeurig voorspellen van de informatie die een luisteraar gemakkelijk kan terugkrijgen, vereist soms dat men veel weet over zijn eerdere ervaring of kennis. De redundantie van de een kan immers de anomalie van de ander zijn, zoals duidelijk werd uit een gesprek dat ik eens had met een medepassagier van een vliegtuig. We vertrokken uit de stad Calgary, aan de voet van de Canadese Rockies. Mijn metgezel, die op weg was naar Florida, vertelde me dat hij een heerlijke vakantie had gehad met zijn gezin, en dat hij een aantal dagen had geskied in de bergen. In mijn Canadese oren klonk dit vreemd – skiën is toch meestal sneeuw? Ik vroeg of hij ooit gewoon de term skiën zou gebruiken. Wel ja, legde hij geduldig uit. Maar dat zou dan op het water zijn.

Julie Sedivy doceert taalkunde en psychologie aan de Universiteit van Calgary, en verhandelt informatie op Twitter @soldonlanguage.

Maternidad y todo

Geef een antwoord Antwoord annuleren