Mumbling Isn’t a Sign of Laziness-It’s a Clever Data-Compression Trick

Everett Collection via

Wielu z nas zostało nauczonych, że niewyraźne wymawianie samogłosek i opuszczanie spółgłosek to objawy niechlujstwa w mowie, jeśli nie jawnego lekceważenia języka angielskiego. John Ervine postrzegał takie nawyki jako dowód na to, że niektórzy mówcy są “słabeuszami zbyt leniwymi i zniedołężniałymi, by mówić w swoim szlachetnym języku z jakimkolwiek wigorem”. Keith Johnson odkrył, że mówcy rozluźniają lub opuszczają głoski w ponad 60 procentach słów wypowiadanych w rozmowie. Szczęśliwie, nauka o mamrotaniu oferuje znacznie mniej osądzania – i bardziej porywającą – relację z naszych niedoskonale wyraźnych wymówień.

Daleko od bycia symptomem językowej obojętności lub moralnego upadku, opuszczanie lub redukcja dźwięków wyświetla podstawową logikę podobną do schematów kompresji danych, które są używane do tworzenia plików MP3 i JPEG. Algorytmy te zmniejszają przestrzeń potrzebną do cyfrowego przechowywania dźwięków i obrazów poprzez usunięcie informacji, które są zbędne lub nie wnoszą wiele do naszego doświadczenia percepcyjnego – na przykład, usunięcie danych o częstotliwościach dźwięku, których nie słyszymy, lub nie zawracanie sobie głowy kodowaniem delikatnych gradacji kolorów, które są trudne do zobaczenia. Chodzi o to, aby zachować tylko te informacje, które mają największy wpływ.

Mumbling-lub redukcji fonetycznej, jak naukowcy języka wolą nazywać to-wydaje się przestrzegać podobnej strategii. Nie wszystkie słowa są w równym stopniu narażone na redukcję. W mowie, jesteś bardziej prawdopodobne, aby zmniejszyć wspólne słowa, takie jak grzywny niż niecodzienne słowa, takie jak tine. Jest również bardziej prawdopodobne, że redukujemy słowa, jeśli są one przewidywalne w kontekście, tak więc słowo “dobrze” będzie wymawiane mniej wyraźnie w zdaniu takim jak “Będzie dobrze” niż “Ostatnie słowo w tym zdaniu to “dobrze””. Sugeruje to, że mówcy, na czysto nieświadomym poziomie, strategicznie zachowują informacje, gdy są one potrzebne, ale często pomijają je, gdy nie przynoszą większych korzyści komunikacyjnych. Mówienie jest wymagającą wysiłku, kosztowną poznawczo czynnością, a poprzez usprawnianie, gdzie się da, mówcy mogą ostatecznie tworzyć lepiej zaprojektowane, bardziej płynne zdania.

Ten rodzaj kompresji danych językowych nie ogranicza się do wymowy: To również napędza decyzje o tym, czy wypowiadać lub pomijać pewne słowa. Jest o wiele bardziej prawdopodobne, że określisz, że twój sąsiad jest policjantem płci żeńskiej lub pielęgniarzem płci męskiej, niż gdyby płcie były odwrócone. Ponieważ większość policjantów to mężczyźni, a większość pielęgniarek to kobiety, historycznie rzecz biorąc, płeć jest dość przewidywalna w zwykłym przypadku; cenna energia poznawcza jest zarezerwowana dla przypadków anomalnych, gdzie słowa mężczyzna i kobieta są bardziej użyteczne.

Bardzo dalekie od bycia symptomem językowej obojętności lub moralnego upadku, usuwanie lub redukowanie dźwięków wykazuje logikę podobną do schematów kompresji danych, które są używane do tworzenia plików MP3 i JPEG.

Pojęcie strategicznego lenistwa, w którym wysiłek i wartość informacyjna są rozsądnie równoważone względem siebie, rozszerza się poza pojedynczych mówców na całe języki, pomagając wyjaśnić, dlaczego mają one pewne właściwości. Na przykład, oferuje ono pewien wgląd w to, dlaczego języki tolerują ogromne ilości wieloznaczności w swoich słownikach: Mówcy mogą przetwarzać łatwe do wymówienia słowa i zwroty, aby nabrały wielu znaczeń, w sytuacjach, w których słuchacze mogą łatwo odtworzyć intencje mówcy. Zostało to również przywołane w celu wyjaśnienia faktu, że w różnych językach, najczęściej używane słowa są krótkie, niosąc ze sobą minimalną ilość informacji fonetycznych, a także w celu wyjaśnienia, dlaczego języki przyjmują pewne porządki słów.

Możesz również zobaczyć strategiczną kompresję danych w akcji poprzez sprawdzenie kolorowych słowników w różnych językach. Niektóre języki radzą sobie z zaledwie trzema lub czterema odrębnymi słowami dla koloru; na przykład język Lele, używany przez dziesiątki tysięcy ludzi w Czadzie, używa jednego słowa, aby objąć żółty, zielony i niebieski. Języki z minimalistycznym słownikiem kolorów są zwykle używane w społeczeństwach przedindustrialnych, gdzie istnieje bardzo niewiele przedmiotów, do których kolor został sztucznie zastosowany. Oznacza to, że mówiący odnoszą się głównie do naturalnych obiektów, dla których kolor jest wysoce przewidywalny, tak jak płeć tradycyjnie była dla pielęgniarek czy policjantów. Jeśli przypomnisz sobie, kiedy ostatnio prosiłeś kogoś, by wyszedł i skosił zieloną trawę lub kupił ci żółte banany, łatwiej będzie ci zrozumieć, jak język może sobie poradzić bez obfitego menu kolorowych słów – zwłaszcza na obszarze bez obfitości produktów konsumpcyjnych.

Pomimo że istnieje wiele powodów, by wierzyć, że język wymaga dużej kompresji danych bez katastrofalnej utraty znaczenia, naukowcy wciąż wiedzą bardzo niewiele o tym, jak mówcy ustalają, jakie dokładnie informacje mogą sobie pozwolić na pominięcie i kiedy. Algorytmy kompresji danych używane do tworzenia plików MP3 opierają się na wielu eksperymentach psychoakustycznych, które badały najdrobniejsze szczegóły ludzkiej percepcji słuchowej. Czy mówcy mają ukryte teorie na temat tego, jakie informacje są najbardziej istotne dla ich słuchaczy? Jeśli tak, to jak te teorie wyglądają i jak mówcy do nich dochodzą? I co zrobić z faktem, że ludzie czasem mamroczą niezrozumiale, wyrzucając z siebie albo zbyt wiele informacji, albo niewłaściwe? (Zobacz też wcześniejszy post Aatisha Bhatii, “The Math Trick Behind MP3s, JPEGs, and Homer Simpson’s Face”).

Nie wiemy też, jak dobrze głośniki dostrajają swoje algorytmy kompresji danych do potrzeb poszczególnych słuchaczy. Precyzyjne przewidywanie informacji, które słuchacz może z łatwością odzyskać, wymaga czasem dużej wiedzy o jego wcześniejszych doświadczeniach lub wiedzy. W końcu nadmiarowość u jednej osoby może być anomalią u innej, co uświadomiła mi pewna wymiana zdań z pasażerem samolotu. Odlatywaliśmy z miasta Calgary, położonego w pobliżu kanadyjskich gór Rockies. Mój towarzysz, który zmierzał do domu na Florydzie, powiedział mi, że spędził urocze wakacje z rodziną, spędzając kilka dni na nartach w górach. Dla moich kanadyjskich uszu brzmiało to dziwnie – czyż jazda na nartach nie wiąże się zazwyczaj ze śniegiem? Zapytałem, czy kiedykolwiek użyłby określenia “narty”. Cóż, tak – wyjaśnił cierpliwie. Ale wtedy, to byłoby na wodzie.

Julie Sedivy uczy lingwistyki i psychologii na Uniwersytecie w Calgary, i handluje informacjami na Twitterze @soldonlanguage.

.

Dodaj komentarz

Twój adres e-mail nie zostanie opublikowany.