Mumlande är inte ett tecken på lathet – det är ett smart trick för datakomprimering

Everett Collection via

Väldigt många av oss har lärt oss att det är ett symptom på slarvigt tal att uttala vokaler otydligt och att släppa konsonanter, om inte rent ut sagt ett förakt för det engelska språket. Den irländske dramatikern St John Ervine betraktade sådana vanor som ett bevis på att vissa talare är “veklingar som är alltför slöa och emaskulerade för att tala sitt ädla språk med någon kraft”. Om det är så, så simmar vi i ett hav av språklig mesighet; Keith Johnson fann att talare slappnade av eller släppte ljud i mer än 60 procent av de ord som talades i en konversation. Lyckligtvis erbjuder vetenskapen om mumlande en mycket mindre dömande – och mer fängslande – redogörelse för vårt ofullkomligt skarpa uttal.

Långt ifrån att vara ett symptom på språklig likgiltighet eller moraliskt förfall uppvisar borttagning eller minskning av ljud en underliggande logik som liknar de system för datakomprimering som används för att skapa MP3- och JPEG-filer. Dessa algoritmer minskar det utrymme som behövs för att digitalt lagra ljud och bilder genom att kasta ut information som är överflödig eller som inte tillför mycket till vår perceptuella upplevelse – till exempel genom att kasta ut data vid ljudfrekvenser som vi inte kan höra, eller genom att inte bry sig om att koda små färggraderingar som är svåra att se. Tanken är att bara behålla den information som har störst effekt.

Mumlande – eller fonetisk reduktion, som språkvetare föredrar att kalla det – verkar följa en liknande strategi. Det är inte lika troligt att alla ord reduceras. I tal är det mer sannolikt att man reducerar vanliga ord som fine än ovanliga ord som tine. Det är också mer sannolikt att man reducerar ord om de är förutsägbara i sammanhanget, så att ordet fine skulle uttalas mindre tydligt i en mening som “You’re going to be just fine” än “The last word in this sentence is fine”. Detta tyder på att talare, på en rent omedveten nivå, strategiskt bevarar information när den behövs, men ofta utelämnar den när den inte ger någon större kommunikativ vinst. Att tala är en ansträngande, kognitivt kostsam aktivitet, och genom att effektivisera där de kan, kan talare i slutändan producera bättre utformade, mer flytande meningar.

Denna typ av språklig datakomprimering är inte begränsad till uttal: Den styr också beslut om huruvida vissa ord ska uttalas eller utelämnas. Det är mycket mer sannolikt att du anger att din granne är en kvinnlig polis eller en manlig sjuksköterska än om könen var ombytta. Eftersom de flesta poliser historiskt sett har varit män och de flesta sjuksköterskor kvinnor är kön ganska förutsägbart i det vanliga fallet; dyrbar kognitiv energi reserveras för de avvikande fallen, där orden manlig och kvinnlig är mer användbara.

Långt ifrån att vara ett symtom på språklig likgiltighet eller moraliskt förfall uppvisar bortfallet eller minskningen av ljud en underliggande logik som liknar de system för datakomprimering som används för att skapa MP3-filer och JPEG-filer.

Föreställningen om strategisk lathet, där ansträngning och informationsvärde balanseras på ett klokt sätt mot varandra, skalar upp bortom enskilda talare till hela språk och bidrar till att förklara varför de har vissa egenskaper. Den ger till exempel en viss insikt i varför språk tolererar enorma mängder tvetydighet i sina vokabulärer: Talare kan återanvända ord och fraser som är lätta att uttala för att få flera olika betydelser, i situationer där lyssnarna lätt kan återfinna talarens avsikt. Den har också åberopats för att förklara det faktum att de vanligaste orden i olika språk tenderar att vara korta och innehålla minimala mängder fonetisk information, och för att förklara varför språk antar vissa ordföljder.

Man kan också se strategisk datakomprimering i aktion genom att inspektera färgvokabulären i olika språk. Vissa språk klarar sig med bara tre eller fyra olika ord för färg; till exempel använder Lele-språket, som talas av tiotusentals människor i Tchad, ett enda ord för att omfatta gult, grönt och blått. Språk med minimalistiska färgvokabulärer tenderar att talas i förindustriella samhällen, där det finns mycket få tillverkade föremål som har färgats på konstgjord väg. Detta innebär att talarna oftast hänvisar till naturliga föremål, för vilka färg är mycket förutsägbart, precis som kön traditionellt har varit för sjuksköterskor eller poliser. Om du tänker tillbaka på den senaste gången du bad någon att gå ut och klippa det gröna gräset eller köpa några gula bananer till dig, blir det lättare att se hur ett språk kan klara sig utan en riklig meny av färgord – särskilt i ett område utan ett överflöd av konsumtionsvaror.

Men även om det finns många anledningar till att tro att språket inbegriper en hel del datakomprimering utan katastrofal förlust av innebörd, vet vet forskarna fortfarande väldigt lite om hur talare räknar ut exakt vilken information de kan kosta på sig att utelämna och när. De datakomprimeringsalgoritmer som används för att skapa MP3-filer är baserade på mängder av psykoakustiska experiment som undersökte de fina detaljerna i den mänskliga hörseluppfattningen. Har talare implicita teorier om vilken information som är viktigast för lyssnarna? Om så är fallet, hur ser dessa teorier ut och hur kommer talarna fram till dem? Och vad ska man göra av det faktum att människor ibland mumlar obegripligt och ger antingen för mycket information eller fel information? (Se även Aatish Bhatias tidigare inlägg “The Math Trick Behind MP3s, JPEGs, and Homer Simpson’s Face”).

Vi vet inte heller hur väl högtalarna anpassar sina datakomprimeringsalgoritmer till enskilda lyssnares behov. För att exakt förutsäga vilken information som en lyssnare lätt kan återvinna krävs det ibland att man vet en hel del om hans tidigare erfarenheter eller kunskaper. När allt kommer omkring kan en persons redundans vara en annan persons anomali, vilket klargjordes av en diskussion som jag en gång hade med en annan flygpassagerare. Vi var på väg från staden Calgary, intill de kanadensiska bergskedjorna. Min kamrat, som var på väg hem till Florida, berättade för mig att han hade haft en härlig semester med sin familj och tillbringat flera dagar med skidåkning i bergen. I mina kanadensiska öron lät detta märkligt – brukar inte skidåkning innebära snö? Jag frågade om han någonsin skulle använda termen skidåkning. Ja, det gjorde han, förklarade han tålmodigt. Men då skulle det vara på vattnet.

Julie Sedivy undervisar i lingvistik och psykologi vid University of Calgary och byter information på Twitter @soldonlanguage.

Lämna ett svar

Din e-postadress kommer inte publiceras.