Mumlen er ikke et tegn på dovenskab - det er et smart trick til datakomprimering - Fakta så romantisk - Nautilus

Mange af os har lært, at det at udtale vokaler utydeligt og udelade konsonanter er symptomer på sløset tale, hvis ikke ligefrem foragt for det engelske sprog. Den irske dramatiker St. John Ervine betragtede sådanne vaner som et bevis på, at nogle talere er “svæklinge, der er for sløve og umyndige til at tale deres ædle sprog med nogen styrke”. Hvis det er tilfældet, så svømmer vi i et hav af sproglig tøvenhed; Keith Johnson fandt ud af, at talere slappede af eller droppede lyde i mere end 60 procent af de ord, der blev talt i en samtale. Heldigvis tilbyder videnskaben om mumlen en langt mindre fordømmende – og mere fængslende – beretning om vores ufuldstændigt skarpe udtale.

Langt fra at være et symptom på sproglig ligegyldighed eller moralsk forfald viser det at droppe eller reducere lyde en underliggende logik, der ligner de datakomprimeringsordninger, der anvendes til at skabe MP3’er og JPEG’er. Disse algoritmer reducerer den plads, der er nødvendig for at lagre lyd og billeder digitalt, ved at smide information ud, der er overflødig eller ikke tilføjer meget til vores perceptuelle oplevelse – f.eks. ved at smide data ud ved lydfrekvenser, vi ikke kan høre, eller ved ikke at gøre sig den ulejlighed at indkode små farvegradueringer, der er svære at se. Ideen er kun at beholde de oplysninger, der har størst betydning.

Mumling – eller fonetisk reduktion, som sprogforskere foretrækker at kalde det – ser ud til at følge en lignende strategi. Det er ikke alle ord, der har lige stor sandsynlighed for at blive reduceret. I tale er det mere sandsynligt, at man reducerer almindelige ord som f.eks. fine end ualmindelige ord som tine. Det er også mere sandsynligt, at man reducerer ord, hvis de er forudsigelige i konteksten, således at ordet fine ville blive udtalt mindre tydeligt i en sætning som “Du skal nok klare dig fint” end “Det sidste ord i denne sætning er fint”. Dette tyder på, at talere på et rent ubevidst plan strategisk bevarer oplysninger, når de er nødvendige, men ofte udelader dem, når de ikke giver meget kommunikativt udbytte. At tale er en anstrengende, kognitivt dyr aktivitet, og ved at strømline, hvor de kan, kan talerne i sidste ende producere bedre udformede, mere flydende sætninger.

Denne form for sproglig datakomprimering er ikke begrænset til udtale: Den styrer også beslutninger om, hvorvidt bestemte ord skal udtales eller udelades. Du er langt mere tilbøjelig til at angive, at din nabo er en kvindelig politibetjent eller en mandlig sygeplejerske, end hvis kønnene var omvendt. Da de fleste politibetjente historisk set har været mænd og de fleste sygeplejersker kvinder, er kønnet ret forudsigeligt i det sædvanlige tilfælde; kostbar kognitiv energi er reserveret til de unormale tilfælde, hvor ordene mand og kvinde er mere nyttige.

Langt fra at være et symptom på sproglig ligegyldighed eller moralsk forfald viser udeladelse eller reduktion af lyde en underliggende logik, der ligner de datakomprimeringsordninger, der bruges til at skabe MP3’er og JPEG’er.

Forestillingen om strategisk dovenskab, hvor indsats og informationsværdi afvejes fornuftigt mod hinanden, skaleres op over individuelle talere til hele sprog og bidrager til at forklare, hvorfor de har visse egenskaber. For eksempel giver den en vis indsigt i, hvorfor sprog tolererer massive mængder af tvetydighed i deres ordforråd: Talerne kan genbruge ord og sætninger, der er lette at udtale, til at antage flere betydninger i situationer, hvor lytterne let kan genfinde talerens hensigt. Det er også blevet påberåbt for at forklare, at de mest almindelige ord på tværs af sprog har en tendens til at være korte og indeholde minimale mængder fonetisk information, og for at forklare, hvorfor sprog anvender bestemte ordstillinger.

Du kan også se strategisk datakomprimering i aktion ved at inspicere farveordforekomster på tværs af sprog. Nogle sprog klarer sig med blot tre eller fire forskellige ord for farve; for eksempel bruger Lele-sproget, der tales af titusinder af mennesker i Tchad, et enkelt ord til at omfatte gul, grøn og blå. Sprog med et minimalistisk farveordforråd har en tendens til at blive talt i førindustrielle samfund, hvor der kun findes meget få fremstillede genstande, som kunstigt er blevet farvelagt. Det betyder, at talerne for det meste henviser til naturlige genstande, for hvilke farve er meget forudsigelig, ligesom køn traditionelt har været det for sygeplejersker eller politibetjente. Hvis man tænker tilbage på den sidste gang, man bad nogen om at gå ud og slå det grønne græs eller købe nogle gule bananer til en, bliver det lettere at se, hvordan et sprog kan klare sig uden en rigelig menu af farveord – især i et område uden en overflod af forbrugsvarer.

Mens der er mange grunde til at tro, at sprog indebærer en stor datakomprimering uden katastrofalt tab af betydning, ved forskerne stadig meget lidt om, hvordan talere finder ud af, præcis hvilke oplysninger de kan tillade sig at udelade og hvornår. De datakomprimeringsalgoritmer, der anvendes til at skabe MP3-filer, er baseret på en lang række psykoakustiske eksperimenter, der har undersøgt de fine detaljer i den menneskelige auditive perception. Har højttalere implicitte teorier om, hvilke oplysninger der er mest væsentlige for deres lyttere? I bekræftende fald, hvordan ser disse teorier ud, og hvordan når talerne frem til dem? Og hvad skal man gøre ved det faktum, at folk sommetider mumler uforståeligt, idet de enten giver for meget information eller den forkerte slags information? (Se også Aatish Bhatias tidligere indlæg “The Math Trick Behind MP3s, JPEGs, and Homer Simpson’s Face.”)

Vi ved heller ikke, hvor godt højttalerne afstemmer deres datakomprimeringsalgoritmer efter de enkelte lytteres behov. En præcis forudsigelse af de oplysninger, som en lytter let kan genvinde, kræver undertiden, at man ved en masse om hans tidligere erfaringer eller viden. Når alt kommer til alt kan den enes redundans være den andens anomali, hvilket blev tydeliggjort af en udveksling, som jeg engang havde med en anden flypassager. Vi var på vej væk fra byen Calgary, der ligger ved siden af de canadiske Rocky Mountains. Min ledsager, som var på vej hjem til Florida, fortalte mig, at han havde haft en dejlig ferie med sin familie, hvor han havde tilbragt flere dage på ski i bjergene. I mine canadiske ører lød det mærkeligt – er skiløb ikke normalt forbundet med sne? Jeg spurgte, om han nogensinde ville bruge ordet skiløb. Nå ja, forklarede han tålmodigt. Men så ville det være på vandet.

Julie Sedivy underviser i lingvistik og psykologi på University of Calgary og udveksler oplysninger på Twitter @soldonlanguage.

Maternidad y todo

Mumlen er ikke et tegn på dovenskab – det er et smart trick til datakomprimering

Skriv et svar Annuller svar