Mumbling Isn’t a Sign of Laziness-I’s a Clever Data-Compression Trick

Everett Collection via

Monille meistä on opetettu, että vokaalien ääntäminen epäselvästi ja konsonanttien poisjättäminen ovat huolimattoman puheen oireita, jos ei suoranaista piittaamattomuutta englannin kieltä kohtaan. Irlantilainen näytelmäkirjailija St. John Ervine piti tällaisia tapoja todisteena siitä, että jotkut puhujat ovat “heikkolahjaisia, jotka ovat liian velttoja ja raihnaisia puhuakseen jaloa kieltään tarmokkaasti”. Jos näin on, uimme kielellisen nössöyden meressä; Keith Johnson havaitsi, että puhujat löysivät tai jättivät pois äänteitä yli 60 prosentissa keskustelun aikana puhutuista sanoista. Onneksi muminaa koskeva tiede tarjoaa paljon vähemmän tuomitsevan – ja kiehtovamman – selonteon epätäydellisen terävistä ääntämyksistämme.

Kaukana siitä, että äänteiden pudottaminen tai vähentäminen olisi oire kielellisestä välinpitämättömyydestä tai moraalisesta rappiosta, sen taustalla on samanlainen logiikka kuin MP3- ja JPEG-tiedostojen luomiseen käytetyissä datan pakkausjärjestelmissä. Nämä algoritmit karsivat äänien ja kuvien digitaaliseen tallentamiseen tarvittavaa tilaa heittämällä pois tietoa, joka on tarpeetonta tai joka ei juurikaan lisää havaintokokemustamme – esimerkiksi heittämällä pois tietoa äänitaajuuksista, joita emme kuule, tai jättämällä vaivaamatta koodaamaan vähäisiä värisävyjä, joita on vaikea nähdä. Ajatuksena on säilyttää vain se tieto, jolla on suurin vaikutus.

Mumbaaminen – tai foneettinen reduktio, kuten kielentutkijat sitä mieluummin kutsuvat – näyttää noudattavan samanlaista strategiaa. Kaikkia sanoja ei vähennetä yhtä todennäköisesti. Puheessa pelkistetään todennäköisemmin yleisiä sanoja, kuten fine, kuin harvinaisia sanoja, kuten tine. Sanoja pienennetään myös todennäköisemmin, jos ne ovat kontekstissa ennakoitavissa, joten sana fine äännetään vähemmän selvästi lauseessa kuten “Sinulla menee hyvin” kuin “Tämän lauseen viimeinen sana on fine”. Tämä viittaa siihen, että puhujat säilyttävät puhtaasti tiedostamattomalla tasolla strategisesti tietoa silloin, kun sitä tarvitaan, mutta jättävät sen usein pois silloin, kun se ei tarjoa suurta kommunikatiivista hyötyä. Puhuminen on vaivalloista ja kognitiivisesti kallista toimintaa, ja virtaviivaistamalla siellä, missä se on mahdollista, puhujat voivat lopulta tuottaa paremmin suunniteltuja, sujuvampia lauseita.

Tällainen kielellisen tiedon pakkaaminen ei rajoitu vain ääntämiseen: Se ohjaa myös päätöksiä siitä, lausutaanko vai jätetäänkö tiettyjä sanoja pois. Määrittelet paljon todennäköisemmin, että naapurisi on naispuolinen poliisi tai miespuolinen sairaanhoitaja, kuin jos sukupuolet olisivat päinvastaiset. Koska suurin osa poliiseista on historiallisesti ollut miehiä ja suurin osa sairaanhoitajista naisia, sukupuoli on tavallisessa tapauksessa melko hyvin ennakoitavissa; arvokasta kognitiivista energiaa varataan poikkeaviin tapauksiin, joissa sanat mies ja nainen ovat hyödyllisempiä.

Kaukana siitä, että äänteiden poisjättäminen tai vähentäminen olisi oire kielellisestä välinpitämättömyydestä tai moraalisesta rappeutumisesta, on havaittavissa perimmäinen logiikka, joka on samankaltainen kuin datanpakkausmenetelmissä, joilla luodaan MP3-äänitteitä ja JPEG-tiedostoja.

Käsitys strategisesta laiskuudesta, jossa vaivannäkö ja informaatioarvo tasapainotetaan harkitusti toisiaan vastaan, ulottuu yksittäisiä puhujia laajemmalle ja ulottuu kokonaisiin kieliin, mikä auttaa selittämään, miksi niillä on tiettyjä ominaisuuksia. Se tarjoaa esimerkiksi jonkinlaisen käsityksen siitä, miksi kielet sietävät valtavia määriä moniselitteisyyttä sanastoissaan: Puhujat voivat kierrättää helposti lausuttavia sanoja ja lauseita, jotta ne saisivat useita merkityksiä tilanteissa, joissa kuulijat voivat helposti selvittää puhujan tarkoituksen. Siihen on vedottu myös selittämään, miksi kielissä yleisimmät sanat ovat yleensä lyhyitä ja sisältävät minimaalisen määrän foneettista tietoa, ja selittämään, miksi kielet omaksuvat tiettyjä sanajärjestyksiä.

Strategisen tiedonpakkauksen voi nähdä toiminnassa myös tarkastelemalla eri kielten värisanastoja. Joissakin kielissä riittää vain kolme tai neljä erillistä sanaa väreille; esimerkiksi lele-kieli, jota puhuvat kymmenet tuhannet ihmiset Tšadissa, käyttää yhtä ainoaa sanaa, joka kattaa keltaisen, vihreän ja sinisen. Kieliä, joilla on minimaalinen värisanasto, puhutaan yleensä esiteollisissa yhteiskunnissa, joissa on hyvin vähän valmistettuja esineitä, joihin on keinotekoisesti lisätty värejä. Tämä tarkoittaa, että puhujat viittaavat useimmiten luonnollisiin esineisiin, joiden väri on hyvin ennustettavissa, aivan kuten sukupuoli on perinteisesti ollut sairaanhoitajille tai poliiseille. Jos muistelet viimeistä kertaa, kun pyysit jotakuta leikkaamaan vihreää ruohoa tai ostamaan keltaisia banaaneja, on helpompi ymmärtää, miten kieli voi tulla toimeen ilman runsasta värisanavalikoimaa – varsinkin alueella, jossa ei ole runsaasti kulutustavaroita.

Vaikka on monia syitä uskoa, että kieleen liittyy paljon tiedon tiivistämistä ilman, että merkitys kärsii katastrofaalista menetystä, tutkijat tietävät yhä vain vähän siitä, miten puhujat päättelevät, mitä tietoja heillä on varaa jättää mainitsematta ja milloin. MP3-tiedostojen luomiseen käytetyt tiedonpakkausalgoritmit perustuvat lukuisiin psykoakustisiin kokeisiin, joissa tutkittiin ihmisen kuulohavainnon hienouksia. Onko puhujilla implisiittisiä teorioita siitä, mikä tieto on kuulijoille kaikkein olennaisinta? Jos on, millaisia nämä teoriat ovat ja miten puhujat päätyvät niihin? Entä mitä mieltä ollaan siitä, että ihmiset mumisevat joskus käsittämättömästi, koska he kertovat joko liikaa tai vääränlaista tietoa? (Katso myös Aatish Bhatian aiempi kirjoitus “The Math Trick Behind MP3s, JPEGs, and Homer Simpson’s Face”.)

Me emme myöskään tiedä, kuinka hyvin kaiuttimet virittävät datan pakkausalgoritmejaan yksittäisten kuuntelijoiden tarpeisiin. Sen informaation tarkka ennustaminen, jonka kuulija voi helposti ottaa talteen, vaatii joskus paljon tietoa hänen aiemmista kokemuksistaan tai tiedoistaan. Loppujen lopuksi yhden ihmisen redundanssi voi olla toisen ihmisen anomalia, kuten kävi selväksi eräässä keskustelussa, jonka kävin kerran erään lentomatkustajakollegani kanssa. Olimme lähdössä Calgaryn kaupungista, Kanadan Kalliovuorten vierestä. Matkakumppanini, joka oli matkalla kotiin Floridaan, kertoi minulle, että hänellä oli ollut ihana loma perheensä kanssa, ja hän oli viettänyt useita päiviä hiihtäen vuoristossa. Kanadalaiseen korvaani tämä kuulosti oudolta – eikö hiihtämiseen yleensä liity lunta? Kysyin, käyttäisikö hän koskaan vain termiä hiihto. No kyllä, hän selitti kärsivällisesti. Mutta silloin se olisi vesillä.

Julie Sedivy opettaa kielitiedettä ja psykologiaa Calgaryn yliopistossa ja vaihtaa tietoja Twitterissä @soldonlanguage.

Vastaa

Sähköpostiosoitettasi ei julkaista.