Pochodzenie mowy - Origin of speech

Nerw podjęzykowy
Nerw podjęzykowy
	Nerw podjęzykowy, splot szyjny i ich gałęzie
Detale
Identyfikatory
łacina	nerw hipoglossus
	Anatomiczne terminy neuroanatomii [ edytuj na Wikidanych ]

Pochodzenie mowy odnosi się do ogólnego problemu pochodzenia języka w kontekście fizjologicznym rozwoju ludzkich narządów mowy , takich jak język , wargi i narządów głosowych wykorzystywanych do produkcji fonologiczne jednostki w wszystkich ludzkich języków .

Tło

Chociaż jest to związane z ogólniejszym problemem pochodzenia języka , ewolucja charakterystycznych dla człowieka zdolności mowy stała się odrębnym i pod wieloma względami odrębnym obszarem badań naukowych. Temat jest osobny, ponieważ język niekoniecznie jest używany: może być w równym stopniu napisany, jak i podpisany . Mowa jest w tym sensie opcjonalna, chociaż jest domyślną modalnością języka.

Miejsca artykulacji (pasywne i aktywne):
1. Exo-wargowe, 2. Endo-wargowe, 3. Zębowe, 4. Zębodołowe, 5. Zazębowe, 6. Przedpodniebienne, 7. Podniebienne, 8. Welarne, 9 Jajkowaty, 10. Gardłowy, 11. Kruszkowy, 12. Nagłośniowy, 13. Radykalny, 14. Tył-grzbietowy, 15. Przednio-grzbietowy, 16. Laminalny, 17. Wierzchołkowy, 18. Podwierzchołkowy

Bezkontrowersyjne małpy, małpy człekokształtne i ludzie, podobnie jak wiele innych zwierząt, wykształcili wyspecjalizowane mechanizmy do wytwarzania dźwięków do celów komunikacji społecznej. Z drugiej strony żadna małpa ani małpa nie używa języka do takich celów. Bezprecedensowe użycie języka, warg i innych ruchomych części przez nasz gatunek wydaje się umieszczać mowę w zupełnie odrębnej kategorii, co sprawia, że jej ewolucyjne wyłonienie się w oczach wielu uczonych jest intrygującym wyzwaniem teoretycznym.

Niemniej jednak, niedawne spostrzeżenia na temat ewolucji człowieka - a dokładniej ludzkiej ewolucji przybrzeżnej plejstocenu - pomagają zrozumieć, w jaki sposób ewoluowała ludzka mowa: różne biologiczne preadaptacje do języka mówionego mają swoje źródło w naszej nadbrzeżnej przeszłości, takiej jak większy mózg (dzięki DHA i innym mózgom- specyficzne składniki odżywcze w owocach morza), dobrowolne oddychanie (nurkowanie na wstrzymanym oddechu dla skorupiaków itp.) oraz karmienie ssące miękkich, śliskich owoców morza. Karmienie przez ssanie wyjaśnia, dlaczego ludzie, w przeciwieństwie do innych człekokształtnych, wyewoluowali zejście gnykowe (kości języka opadało do gardła), zamknięte rzędy zębów (z siekaczymi kłymi) i kulisty język idealnie dopasowany do wysklepionego i gładkiego podniebienia (bez poprzecznego grzbiety jak u małp): wszystko to pozwalało na wymowę spółgłosek. Inne, prawdopodobnie starsze, preadaptacje do ludzkiej mowy to pieśni terytorialne oraz duety przypominające gibon i uczenie się wokalu. Nauka głosu, umiejętność naśladowania dźwięków - jak u wielu ptaków i nietoperzy oraz wielu waleni i pinnipedii - jest prawdopodobnie wymagana do zlokalizowania lub odnalezienia (wśród liści lub w morzu) potomstwa lub rodziców. Rzeczywiście, niezależne linie dowodowe (porównawcze, kopalne, archeologiczne, paleośrodowiskowe, izotopowe, żywieniowe i fizjologiczne) pokazują, że wczesnoplejstoceński „archaiczny” Homo rozprzestrzenił się międzykontynentalnie wzdłuż wybrzeży Oceanu Indyjskiego (dotarli nawet do zamorskich wysp, takich jak Flores). gdzie regularnie nurkowali w poszukiwaniu pokarmów przybrzeżnych, takich jak skorupiaki i raki, które są niezwykle bogate w składniki odżywcze specyficzne dla mózgu, co wyjaśnia powiększenie mózgu Homo. Płytkie nurkowanie w przypadku owoców morza wymaga dobrowolnej kontroli dróg oddechowych, co jest warunkiem wstępnym dla języka mówionego. Owoce morza, takie jak skorupiaki, generalnie nie wymagają gryzienia i żucia, ale używania narzędzi kamiennych i karmienia przyssawką. Ta dokładniejsza kontrola aparatu ustnego była prawdopodobnie kolejną biologiczną preadaptacją do ludzkiej mowy, zwłaszcza do produkcji spółgłosek.

Niezależność od modalności

Obszary językowe ludzkiego mózgu. Kątowe zębaty jest przedstawiony na pomarańczowo supramarginal zębaty jest przedstawiony na żółto, obszar Broca przedstawiono na niebiesko, obszar Wernickego jest przedstawiony na zielono, a pierwotne korze słuchowej jest przedstawiony na różowo.

Termin modalność oznacza wybrany format reprezentacji do kodowania i przesyłania informacji. Uderzającą cechą języka jest to, że jest on niezależny od modalności. Jeżeli upośledzone dziecko nie może słyszeć lub wydawać dźwięków, jego wrodzona zdolność do opanowania języka może w równym stopniu wyrażać się w migowaniu. Języki migowe osób niesłyszących zostały wynalezione niezależnie i posiadają wszystkie główne właściwości języka mówionego, z wyjątkiem modalności przekazu. Z tego wynika, że ośrodki językowe ludzkiego mózgu musiały ewoluować, aby funkcjonować optymalnie niezależnie od wybranej modalności.

„Oderwanie się od danych wejściowych związanych z modalnością może oznaczać istotną zmianę w organizacji neuronalnej, która wpływa nie tylko na naśladowanie, ale także na komunikację; tylko ludzie mogą stracić jedną modalność (np. słuch) i nadrobić ten deficyt poprzez komunikowanie się z pełną kompetencją w inna modalność (tj. podpisywanie)."

— Marc Hauser, Noam Chomsky i W. Tecumseh Fitch, 2002. Wydział Języka: co to jest, kto go ma i jak ewoluował?

Figura 18 z Darwina „S ekspresji emocji u ludzi i zwierząt . Podpis głosi: „Szympans rozczarowany i nadąsany. Wyrwany z życia przez pana Wooda”.

Ta funkcja jest niezwykła. Systemy komunikacji zwierząt rutynowo łączą widoczne z słyszalnymi właściwościami i efektami, ale żaden nie jest niezależny od modalności. Na przykład, żaden wieloryb, delfin czy ptak śpiewający z upośledzeniem głosu nie byłby w stanie wyrazić swojego repertuaru pieśni w równym stopniu w formie wizualnej. Rzeczywiście, w przypadku komunikacji zwierząt, przekazu i modalności nie da się rozplątać. Jakiekolwiek przesłanie jest przekazywane, wynika z nieodłącznych właściwości sygnału.

Niezależności od modalności nie należy mylić ze zwykłym zjawiskiem multimodalności. Małpy i małpy człekokształtne polegają na repertuarze charakterystycznych dla gatunku „wezwań gestów” — emocjonalnie ekspresyjnych wokalizacji nieodłącznych od towarzyszących im wizualnych pokazów. Ludzie mają również charakterystyczne dla gatunku gesty – śmiechy, płacz, szloch i tak dalej – wraz z mimowolnymi gestami towarzyszącymi mowie. Wiele wyświetlaczy zwierzęcych jest polimodalnych, ponieważ każdy wydaje się być zaprojektowany do jednoczesnego wykorzystywania wielu kanałów.

Ludzka właściwość językowa „niezależności od modalności” jest konceptualnie odmienna od tej. Pozwala mówcy na kodowanie treści informacyjnej wiadomości w jednym kanale, podczas gdy jest to konieczne przełączanie się między kanałami. Współcześni mieszkańcy miast bez trudu przełączają się między słowem mówionym a pismem w jego różnych formach — pisma ręcznego, pisania na maszynie, e-maili i tak dalej. Niezależnie od wybranej modalności, może niezawodnie przesyłać pełną treść wiadomości bez jakiejkolwiek pomocy z zewnątrz. Na przykład podczas rozmowy przez telefon towarzyszące gesty mimiczne lub manualne, nawet naturalne dla mówiącego, nie są bezwzględnie konieczne. Podczas pisania lub ręcznego podpisywania, odwrotnie, nie ma potrzeby dodawania dźwięków. W wielu kulturach australijskich Aborygenów część populacji — być może kobiety przestrzegające rytualnego tabu — tradycyjnie ogranicza się przez dłuższy czas do cichej (podpisywanej ręcznie) wersji swojego języka. Następnie, po uwolnieniu z tabu, te same osoby powracają do opowiadania historii przy kominku lub w ciemności, przełączając się na czysty dźwięk bez poświęcania treści informacyjnych.

Ewolucja narządów mowy

Ludzki trakt głosowy

Mówienie jest domyślną modalnością języka we wszystkich kulturach. Pierwszym wyjściem człowieka jest zakodowanie naszych myśli w dźwiękach — metoda, która opiera się na wyrafinowanych zdolnościach kontrolowania ust, języka i innych elementów aparatu głosowego.

Wszyscy zgadzają się, że narządy mowy wyewoluowały w pierwszej kolejności nie dla mowy, ale dla bardziej podstawowych funkcji organizmu, takich jak karmienie i oddychanie. Naczelne inne niż człowiek mają zasadniczo podobne narządy, ale z różnymi kontrolami nerwowymi. Małpy człekokształtne używają swoich bardzo elastycznych, zwrotnych języków do jedzenia, ale nie do wokalizacji. Kiedy małpa nie je, precyzyjna kontrola motoryczna nad językiem jest dezaktywowana. Albo wykonuje gimnastykę językiem, albo wokalizuje; nie może wykonywać obu czynności jednocześnie. Ponieważ dotyczy to ogólnie ssaków, Homo sapiens jest wyjątkowy w wykorzystywaniu mechanizmów zaprojektowanych do oddychania i spożywania pokarmu do radykalnie odmiennych wymagań mowy artykulacyjnej.

Język

Spektrogram samogłosek anglojęzycznych [i, u, ɑ] z formantami f ₁ i f ₂

Słowo „język” pochodzi od łacińskiego lingua, „język”. Fonetycy są zgodni, że najważniejszym artykulatorem mowy jest język, a następnie usta. Język naturalny można postrzegać jako szczególny sposób używania języka do wyrażania myśli.

Język ludzki ma niezwykły kształt. U większości ssaków jest to długa, płaska struktura zawarta głównie w jamie ustnej. Jest przymocowany z tyłu do kości gnykowej , znajdującej się poniżej poziomu jamy ustnej w gardle . U ludzi język ma prawie okrągły kontur strzałkowy (linia środkowa), z czego większość leży pionowo w wysuniętej części gardła , gdzie jest przyczepiona do kości gnykowej w obniżonym położeniu. Częściowo w wyniku tego pozioma (wewnątrz ust) i pionowa (w gardle) rurka tworząca nadgardłowy trakt głosowy (SVT) są prawie równej długości (podczas gdy u innych gatunków przekrój pionowy jest krótszy ). Gdy poruszamy szczękami w górę iw dół, język może zmieniać pole przekroju każdej rurki niezależnie o około 10:1, odpowiednio zmieniając częstotliwości formantów. To, że rurki są połączone pod kątem prostym, umożliwia wymowę samogłosek [i], [u] i [a] , czego naczelne nie potrafią zrobić. Nawet jeśli nie jest wykonywana szczególnie dokładnie, gimnastyka artykulacyjna potrzebna do odróżnienia tych samogłosek u ludzi daje spójne, charakterystyczne wyniki akustyczne, ilustrujące kwantową naturę ludzkich dźwięków mowy. To może nie być przypadek, że [i], [u] i [a] są najczęstszymi samogłoskami w językach świata. Języki ludzkie są dużo krótsze i cieńsze niż inne ssaki i składają się z dużej liczby mięśni, co pomaga w kształtowaniu różnych dźwięków w jamie ustnej. Różnorodność wydawania dźwięków zwiększa się również dzięki zdolności człowieka do otwierania i zamykania dróg oddechowych, co pozwala na uchodzenie różnych ilości powietrza przez nos. Delikatne ruchy motoryczne związane z językiem i drogami oddechowymi sprawiają, że ludzie są bardziej zdolni do wytwarzania szerokiej gamy skomplikowanych kształtów w celu wytwarzania dźwięków o różnej szybkości i natężeniu.

Usta

U ludzi, wargi są ważne dla produkcji przystanków i niesyczących , oprócz samogłosek . Nic jednak nie sugeruje, że usta wyewoluowały właśnie z tych powodów. Podczas ewolucji naczelnych przejście od aktywności nocnej do dziennej u wyraków , małp i małp ( haplorhinów ) przyniosło ze sobą zwiększone uzależnienie od wzroku kosztem węchu. W rezultacie, pysk został zmniejszony i rhinarium lub „mokry nos” zaginął. W rezultacie mięśnie twarzy i ust stały się mniej napięte, umożliwiając ich kooptację w celu wyrażania twarzy. Wargi również stały się grubsze, a ukryta za nimi jama ustna zmniejszyła się. „Stąd”, według jednego z głównych autorytetów, „ewolucja ruchliwych, muskularnych ust, tak ważnych dla ludzkiej mowy, była wymownym rezultatem ewolucji dobowości i komunikacji wizualnej u wspólnego przodka haplorinów”. Nie jest jasne, czy nasze usta przeszły nowszą adaptację do specyficznych wymagań mowy.

Kontrola oddechowa

W porównaniu z naczelnymi nie będącymi ludźmi, ludzie mają znacznie lepszą kontrolę oddychania, umożliwiając wydłużenie wydechów i skrócenie wdechów, gdy mówimy. Kiedy mówimy, mięśnie międzyżebrowe i wewnętrzne brzucha są zaangażowane do rozszerzenia klatki piersiowej i wciągania powietrza do płuc, a następnie do kontrolowania uwalniania powietrza podczas opróżniania płuc. Odnośne mięśnie są znacznie bardziej unerwione u ludzi niż u naczelnych. Dowody skamieniałych homininów sugerują, że konieczne poszerzenie kanału kręgowego, a zatem i wymiarów rdzenia kręgowego, mogło nie mieć miejsca u australopiteków czy Homo erectus, ale było obecne u neandertalczyków i ludzi we wczesnych latach nowożytnych.

Krtań

Anatomia krtani, widok przednio-boczny

Krtani lub krtań jest narządem w szyję obudowy fałdów głosowych , które są odpowiedzialne za fonacji . U ludzi krtań jest opuszczona, jest umieszczona niżej niż u innych naczelnych. Dzieje się tak, ponieważ ewolucja człowieka do pozycji pionowej przesunęła głowę bezpośrednio nad rdzeń kręgowy, zmuszając wszystko inne w dół. Zmiana położenia krtani spowodowała powstanie dłuższej jamy zwanej gardłem, która odpowiada za zwiększenie zasięgu i wyrazistości wytwarzanego dźwięku. Inne naczelne prawie nie mają gardła; dlatego ich moc głosu jest znacznie niższa. Nasz gatunek nie jest pod tym względem wyjątkowy: kozy, psy, świnie i tamaryny chwilowo opuszczają krtań, by wydawać głośne wołanie. Kilka gatunków jeleni ma trwale opuszczoną krtań, która może być jeszcze bardziej opuszczona przez samce podczas pokazów ryczących. Tak samo robią lwy, jaguary, gepardy i koty domowe. Jednak zejściem krtani u nieludzi (według Philipa Liebermana) nie towarzyszy zejście gnykowej; stąd język pozostaje poziomy w jamie ustnej, uniemożliwiając mu działanie jako artykulator gardła.

Przednio-boczny widok głowy i szyi

Mimo to uczeni pozostają podzieleni co do tego, jak „wyjątkowy” jest naprawdę ludzki trakt głosowy. Wykazano, że krtań w pewnym stopniu opada w czasie rozwoju szympansów , po czym następuje opadanie gnykowe. W przeciwieństwie do tego, Philip Lieberman wskazuje, że tylko ludzie rozwinęli trwałe i znaczne zejście krtani w połączeniu z zejściem gnykowym, co skutkuje zakrzywieniem języka i dwuprzewodowym traktem głosowym w proporcjach 1:1. Wyjątkowo w przypadku ludzi, prosty kontakt między nagłośnią a welum nie jest już możliwy, co zakłóca normalne oddzielanie się dróg oddechowych i przewodu pokarmowego ssaków podczas połykania. Ponieważ pociąga to za sobą znaczne koszty — zwiększające ryzyko zakrztuszenia się podczas połykania pokarmu — jesteśmy zmuszeni zapytać, jakie korzyści mogły przewyższyć te koszty. Oczywistą korzyścią — tak się twierdzi — musiała być mowa. Ale pomysł ten został mocno zakwestionowany. Jeden zarzut dotyczy tego, że w rzeczywistości ludzie nie są poważnie narażeni na zadławienie się żywnością: statystyki medyczne wskazują, że tego rodzaju wypadki zdarzają się niezwykle rzadko. Innym zarzutem jest to, że zdaniem większości uczonych mowa, jaką znamy, pojawiła się stosunkowo późno w ewolucji człowieka, mniej więcej jednocześnie z pojawieniem się Homo sapiens. Rozwój tak złożony, jak rekonfiguracja układu głosowego człowieka, wymagałby znacznie więcej czasu, co oznacza wczesną datę powstania. Ta rozbieżność w skalach czasowych podważa pogląd, że elastyczność głosu ludzkiego była początkowo napędzana presją selekcji mowy.

Co najmniej jeden orangutan wykazał zdolność kontrolowania skrzynki głosowej.

Hipoteza przesadnej wielkości

Obniżenie krtani to wydłużenie traktu głosowego, z kolei obniżenie częstotliwości formantowych tak, aby głos brzmiał „głębiej” — dając wrażenie większego rozmiaru. John Ohala argumentuje, że funkcja opuszczonej krtani u ludzi, zwłaszcza u mężczyzn, prawdopodobnie polega na wzmacnianiu pokazów zagrożenia, a nie samej mowie. Ohala zwraca uwagę, że gdyby obniżona krtań była przystosowaniem do mowy, spodziewalibyśmy się lepszego przystosowania pod tym względem dorosłych mężczyzn niż dorosłych kobiet, których krtań jest znacznie mniej nisko osadzona. W rzeczywistości kobiety niezmiennie przewyższają mężczyzn w testach werbalnych, fałszując cały ten tok rozumowania. W. Tecumseh Fitch również twierdzi, że była to pierwotna selektywna zaleta obniżania krtani u naszego gatunku. Chociaż (według Fitcha) początkowe obniżenie krtani u ludzi nie miało nic wspólnego z mową, zwiększony zakres możliwych wzorców formantów został później dokooptowany do mowy. Przesada wielkości pozostaje jedyną funkcją ekstremalnego zejścia krtani obserwowanego u samców jelenia. Zgodnie z hipotezą przesadnego rozmiaru, powtórne zejście krtani występuje w okresie dojrzewania u ludzi, choć tylko u mężczyzn. W odpowiedzi na zarzut, że krtań pochodzi od kobiet, Fitch sugeruje, że matki, które wokalizują, by chronić swoje niemowlęta, również skorzystałyby na tej zdolności.

Mowa neandertalska

Kość gnykowa — powierzchnia przednia, powiększona

Większość specjalistów przypisuje neandertalczykom zdolności mowy, które nie różnią się radykalnie od zdolności współczesnych Homo sapiens . Pośrednią argumentacją jest to, że ich taktyka tworzenia narzędzi i polowania byłaby trudna do nauczenia lub wykonania bez jakiejś mowy. Niedawna ekstrakcja DNA z kości neandertalczyków wskazuje, że neandertalczycy mieli tę samą wersję genu FOXP2, co współcześni ludzie. Gen ten, niegdyś błędnie określany jako „gen gramatyczny”, odgrywa rolę w kontrolowaniu ruchów ustno-twarzowych, które (u współczesnych ludzi) są zaangażowane w mowę.

W latach 70. powszechnie uważano, że neandertalczycy nie mają nowoczesnych zdolności mowy. Twierdzono, że posiadali kość gnykową tak wysoko w przewodzie głosowym, że wykluczało to możliwość produkowania pewnych dźwięków samogłoskowych.

Kość gnykowa występuje u wielu ssaków . Pozwala na szeroki zakres ruchów języka, gardła i krtani poprzez usztywnienie tych struktur obok siebie w celu uzyskania zmienności. Obecnie zdajemy sobie sprawę, że jego obniżona pozycja nie jest charakterystyczna dla Homo sapiens , podczas gdy jego znaczenie dla elastyczności głosu może być przesadzone: chociaż mężczyźni mają dolną krtań, nie wydają szerszego zakresu dźwięków niż kobiety lub dwulatki. dzidziusie. Nie ma dowodów na to, że pozycja krtani neandertalczyków utrudniała wydawanie samogłosek. Odkrycie nowocześnie wyglądającej kości gnykowej neandertalczyka w jaskini Kebara w Izraelu skłoniło jej odkrywców do twierdzenia, że neandertalczycy mieli zstępną krtań , a więc zdolności mowy podobne do ludzkich . Jednak inni badacze twierdzili, że morfologia gnykowej nie wskazuje na pozycję krtani. Należy wziąć pod uwagę podstawę czaszki, żuchwę i kręgi szyjne oraz czaszkową płaszczyznę odniesienia.

Morfologia zewnętrznego i ucha środkowego z Bliskiego plejstoceńskich hominidów z Atapuerca SH w Hiszpanii, uważa się, że Proto-neandertalczyka, sugeruje mieli wrażliwości słuchowej podobną do współczesnych ludzi i bardzo różni się od szympansów. Prawdopodobnie byli w stanie rozróżnić wiele różnych dźwięków mowy.

Kanał podjęzykowy

Nerw podjęzykowy odgrywa ważną rolę w kontrolowaniu ruchów języka. W 1998 roku jeden zespół badawczy wykorzystał rozmiar kanału podjęzykowego w podstawie skamieniałych czaszek, próbując oszacować względną liczbę włókien nerwowych, twierdząc na tej podstawie, że homininy ze środkowego plejstocenu i neandertalczycy mieli lepszą kontrolę nad językiem niż którykolwiek z nich. australopiteki lub małpy. Później jednak wykazano, że rozmiar kanału podjęzykowego i rozmiar nerwów nie są skorelowane i obecnie przyjmuje się, że takie dowody nie dostarczają informacji na temat czasu ewolucji mowy człowieka.

Pochodzenie dźwięków mowy

Teoria cech dystynktywnych

IPA : Samogłoski

	Z przodu	Centralny	Plecy
Blisko	i tak	ɨ ʉ	ɯ ty
Prawie blisko	ɪ ʏ		ʊ
Blisko-średni	mi ø	ɘ ɵ	ɤ o
Środek	mi ø̞	ə	ɤ̞ ode
Otwarte-średnie	ɛ œ	ɜ ɞ	ʌ ɔ
Prawie otwarty	…	ɐ
otwarty	a ɶ	a	ɑ ɒ

Samogłoski obok kropek są: niezaokrąglone • zaokrąglone

Według jednej z wpływowych szkół aparat głosowy człowieka jest z natury cyfrowy na wzór klawiatury lub komputera cyfrowego. Jeśli tak, to jest to niezwykłe: nic w aparacie głosowym szympansa nie sugeruje cyfrowej klawiatury, pomimo podobieństw anatomicznych i fizjologicznych. Stawia to pytanie, kiedy i jak w trakcie ewolucji człowieka nastąpiło przejście od struktury i funkcji analogowej do cyfrowej.

Mówi się, że ludzki odcinek nadkrtaniowy jest cyfrowy w tym sensie, że jest układem ruchomych przełączników lub przełączników, z których każdy w dowolnym momencie musi znajdować się w takim lub innym stanie. Na przykład struny głosowe albo wibrują (wytwarzają dźwięk), albo nie wibrują (w trybie cichym). Dzięki prostej fizyce odpowiednia cecha charakterystyczna — w tym przypadku „dźwięk” — nie może znajdować się gdzieś pośrodku. Opcje są ograniczone do „wyłącz” i „włącz”. Równie cyfrowa jest funkcja znana jako „ nosalizacja ”. W każdej chwili podniebienie miękkie lub welum pozwalają lub nie pozwalają na rezonowanie dźwięku w komorze nosowej. W przypadku pozycji warg i języka dozwolone są więcej niż dwa stany palców.

Teoria głosząca, że dźwięki mowy są bytami złożonymi złożonymi z zespołów binarnych cech fonetycznych, została po raz pierwszy wysunięta w 1938 roku przez rosyjskiego językoznawcę Romana Jakobsona . Znaczącym wczesnym zwolennikiem tego podejścia był Noam Chomsky , który rozszerzył je z fonologii na język bardziej ogólnie, w szczególności na studia nad składnią i semantyką. W swojej książce z 1965 r., Aspekty teorii składni, Chomsky potraktował koncepcje semantyczne jako kombinacje binarno-cyfrowych elementów atomowych wyraźnie na modelu teorii cech wyróżniających. Na tej podstawie pozycja leksykalna „kawaler” zostałaby wyrażona jako [+ Człowiek], [+ Mężczyzna], [- Żonaty].

Zwolennicy tego podejścia postrzegają samogłoski i spółgłoski rozpoznawane przez osoby posługujące się określonym językiem lub dialektem w określonym czasie jako byty kulturowe o niewielkim znaczeniu naukowym. Z punktu widzenia nauk przyrodniczych, jednostki, które mają znaczenie, są wspólne dla Homo sapiens ze względu na naszą biologiczną naturę. Łącząc atomowe pierwiastki lub "cechy", w które wszyscy ludzie są z natury wyposażeni, każdy może w zasadzie wygenerować całą gamę samogłosek i spółgłosek, które można znaleźć w dowolnym języku świata, czy to w przeszłości, teraźniejszości czy przyszłości. Charakterystyczne cechy są w tym sensie atomowymi składnikami uniwersalnego języka.

Kontrast brzmieniowy w angielskich frykatywnych
Artykulacja	Bezdźwięczny	Dźwięczny
Wymawiane dolną wargą przy zębach:	[f] ( f )	[v] ( v an )
Wymawiane językiem przy zębach:	[θ] ( p , w, p IGH)	[D], ( p en p r)
Wymawiane językiem w pobliżu dziąseł:	[s] ( s ip )	[z] ( z ip )
Wymawiane ze zwiniętym językiem:	[ʃ] (przed SS ure)	[ʒ] (zarzutu s ure)

Krytyka

W ostatnich latach zakwestionowano pojęcie wrodzonej „gramatyki uniwersalnej” leżącej u podstaw zmienności fonologicznej. Najbardziej obszerna monografia, jaką kiedykolwiek napisano na temat dźwięków mowy, Sounds of the World's Languages, autorstwa Petera Ladefogeda i Iana Maddiesona , nie znalazła praktycznie żadnych podstaw do postulowania pewnej niewielkiej liczby stałych, dyskretnych, uniwersalnych cech fonetycznych. Na przykład, badając 305 języków, natrafili na samogłoski, które były rozmieszczone praktycznie wszędzie wzdłuż kontinuum artykulacyjnego i akustycznego. Ladefoged konkluduje, że cechy fonologiczne nie są zdeterminowane przez naturę ludzką: „Cechy fonologiczne najlepiej uważać za artefakty wymyślone przez językoznawców w celu opisania systemów językowych”. Kontrowersje pozostają nierozwiązane.

Teoria samoorganizacji

Stado ptaków, przykład samoorganizacji w biologii

Samoorganizacja charakteryzuje systemy, w których struktury makroskopowe powstają spontanicznie z lokalnych interakcji między wieloma składnikami systemu. W systemach samoorganizujących się globalnych właściwości organizacyjnych nie można znaleźć na poziomie lokalnym. W języku potocznym samoorganizację z grubsza ujmuje idea organizacji „oddolnej” (w przeciwieństwie do organizacji „odgórnej”). Przykłady samoorganizujących się systemów obejmują kryształki lodu, spirale galaktyk w świecie nieorganicznym, a także plamy na skórze lamparta, architekturę gniazd termitów lub kształt stada szpaków.

Kopiec termitów (Macrotermitinae) w delcie Okawango na obrzeżach Maun w Botswanie

Według wielu fonetyków, dźwięki języka aranżują się i przearanżują poprzez samoorganizację Dźwięki mowy mają zarówno właściwości percepcyjne („jak je słyszysz”), jak i artykulacyjne („jak je wytwarzasz”), wszystkie z ciągłymi wartościami. Głośniki mają tendencję do minimalizowania wysiłku, faworyzując łatwość artykulacji nad wyrazistość. Słuchacze postępują odwrotnie, faworyzując dźwięki, które są łatwe do rozróżnienia, nawet jeśli są trudne do wymówienia. Ponieważ mówcy i słuchacze nieustannie zamieniają się rolami, systemy sylab występujące w językach świata okazują się kompromisem między odrębnością akustyczną z jednej strony, a łatwością artykulacji z drugiej.

Jak dokładnie powstają systemy samogłosek, spółgłosek i sylab? Modele komputerowe oparte na agentach przyjmują perspektywę samoorganizacji na poziomie wspólnoty mowy lub populacji. Dwa główne paradygmaty to (1) iterowany model uczenia się i (2) model gry językowej. Wieloetapowe uczenie się koncentruje się na przekazywaniu z pokolenia na pokolenie, zazwyczaj z tylko jednym agentem w każdym pokoleniu. W modelu gry językowej cała populacja agentów jednocześnie wytwarza, postrzega i uczy się języka, wymyślając nowe formy, gdy zajdzie taka potrzeba.

Kilka modeli pokazało, jak stosunkowo proste wzajemne interakcje głosowe, takie jak naśladowanie, mogą spontanicznie samoorganizować system dźwięków wspólnych dla całej populacji i różnych w różnych populacjach. Na przykład modele opracowane przez Berrah et al., a także de Boera, a ostatnio przeformułowane przy użyciu teorii bayesowskiej, pokazały, jak grupa osób grających w gry imitacyjne może samodzielnie organizować repertuary samogłosek, które mają wspólne właściwości z ludzkimi systemami samogłosek. Na przykład, w modelu de Boera, początkowo samogłoski są generowane losowo, ale agenci uczą się od siebie nawzajem, gdy wielokrotnie wchodzą w interakcje w czasie. Agentka A wybiera ze swojego repertuaru samogłoskę i wydaje ją, nieuchronnie z pewnym hałasem. Agentka B słyszy tę samogłoskę i wybiera najbliższy odpowiednik z własnego repertuaru. Aby sprawdzić, czy to naprawdę pasuje do oryginału, B tworzy samogłoskę, którą wydaje jej się, że usłyszała , po czym A ponownie odwołuje się do własnego repertuaru, aby znaleźć najbliższy odpowiednik. Jeśli pasuje do tego, który początkowo wybrała, gra kończy się sukcesem, w przeciwnym razie zakończyła się niepowodzeniem. „Dzięki powtarzającym się interakcjom”, jak twierdzi de Boer, „pojawiają się systemy samogłosek bardzo podobne do tych występujących w ludzkich językach”.

W innym modelu, fonetyk Björn Lindblom był w stanie przewidzieć, na podstawie samoorganizacji, preferowane wybory systemów samogłosek od trzech do dziewięciu samogłosek na podstawie zasady optymalnego różnicowania percepcyjnego.

Kolejne modele badały rolę samoorganizacji w początkach kodowania fonemicznego i kombinatoryczności, czyli istnienia fonemów i ich systematycznego ponownego wykorzystywania do tworzenia ustrukturyzowanych sylab. Pierre-Yves Oudeyer opracował modele, które wykazały, że podstawowy sprzęt neuronowy do adaptacyjnego holistycznego naśladowania głosu, łączący bezpośrednio reprezentacje motoryczne i percepcyjne w mózgu, może generować spontanicznie współdzielone kombinatoryczne systemy wokalizacji, w tym wzorce fonotaktyczne, w społeczeństwie gaworzących jednostek. Modele te scharakteryzowały również, w jaki sposób wrodzone ograniczenia morfologiczne i fizjologiczne mogą oddziaływać z tymi samoorganizującymi się mechanizmami, aby wyjaśnić zarówno powstawanie regularności statystycznych, jak i różnorodność systemów wokalizacji.

Teoria gestów

Teoria gestów stwierdza, że mowa była stosunkowo późnym etapem rozwoju, stopniowo ewoluując od systemu, który pierwotnie był gestykulacyjny. Nasi przodkowie nie byli w stanie kontrolować swoich wokali w czasie, gdy do komunikacji używano gestów; jednak, gdy powoli zaczęli kontrolować swoje wokalizacje, język mówiony zaczął ewoluować.

Tę teorię wspierają trzy rodzaje dowodów:

Język gestów i język wokalny zależą od podobnych systemów neuronowych. Obszary kory odpowiedzialne za ruchy ust i rąk graniczą ze sobą.
Innych niż człowiek naczelne zminimalizować sygnały głosowe na rzecz instrukcji, twarzy i innych widocznych gestów w celu wyrażenia prostych pojęć i komunikacyjnych zamierzenia w środowisku naturalnym. Niektóre z tych gestów przypominają gesty ludzkie, takie jak „postawa błagania” z wyciągniętymi rękami, którą ludzie dzielą z szympansami.
Neurony lustrzane

Badania wykazały silne poparcie dla idei, że język mówiony i migotanie zależą od podobnych struktur neuronowych. Pacjenci, którzy używali języka migowego i cierpieli na uszkodzenie lewej półkuli , wykazywali takie same zaburzenia w języku migowym, jak pacjenci z głosem w języku ustnym. Inni badacze odkryli, że te same regiony lewej półkuli mózgu były aktywne podczas języka migowego, jak podczas używania języka wokalnego lub pisanego.

Ludzie spontanicznie używają gestów rąk i twarzy podczas formułowania pomysłów, które mają być przekazane w mowie. Istnieje również, oczywiście, wiele języków migowych , powszechnie kojarzonych ze społecznościami osób niesłyszących ; jak wspomniano powyżej, są one równe pod względem złożoności, wyrafinowania i siły wyrazu każdemu językowi ustnemu. Główną różnicą jest to, że „fonemy” są wytwarzane na zewnątrz ciała, artykułowane rękami, ciałem i wyrazem twarzy, a nie wewnątrz ciała artykułowane językiem, zębami, wargami i oddechem.

Wielu psychologów i naukowców badało system lustrzany w mózgu, aby odpowiedzieć na tę teorię, a także na inne teorie behawioralne. Dowody na poparcie neuronów lustrzanych jako czynnika w ewolucji mowy obejmują neurony lustrzane u naczelnych, sukces w nauce małp komunikowania się gestami oraz wskazywanie/gestykulowanie w celu uczenia małych dzieci języka. Fogassi i Ferrari (2014) monitorowali aktywność kory ruchowej małp, w szczególności obszar F5 w obszarze Broca, gdzie znajdują się neurony lustrzane. Zaobserwowali zmiany w aktywności elektrycznej w tym obszarze, gdy małpa wykonywała lub obserwowała różne czynności wykonywane ręką przez kogoś innego. Obszar Broca to region w płacie czołowym odpowiedzialny za produkcję i przetwarzanie języka. Odkrycie w tym rejonie neuronów lustrzanych, które odpalają się, gdy czynność jest wykonywana lub obserwowana konkretnie ręką, silnie wspiera przekonanie, że kiedyś komunikacja odbywała się za pomocą gestów. To samo dotyczy nauczania małych dzieci języka. Kiedy wskazuje się na określony obiekt lub lokalizację, neurony lustrzane w dziecku odpalają, jakby wykonywały akcję, co skutkuje długoterminową nauką

Krytyka

Krytycy zauważają, że ogólnie dla ssaków dźwięk okazuje się najlepszym medium do kodowania informacji do transmisji na odległość z dużą prędkością. Biorąc pod uwagę prawdopodobieństwo, że dotyczyło to również wczesnych ludzi, trudno zrozumieć, dlaczego mieliby porzucić tę skuteczną metodę na rzecz bardziej kosztownych i kłopotliwych systemów wizualnego gestu — tylko po to, by powrócić do dźwięku na późniejszym etapie.

Tytułem wyjaśnienia zaproponowano, że na stosunkowo późnym etapie ewolucji człowieka ręce naszych przodków stały się tak bardzo potrzebne do wytwarzania i używania narzędzi, że przeszkodą stały się konkurencyjne wymagania ręcznego gestów. Mówi się, że przejście na język mówiony nastąpiło dopiero w tym momencie. Ponieważ jednak ludzie na przestrzeni ewolucji wytwarzali i używali narzędzi, większość uczonych nie jest przekonana do tego argumentu. (Aby poznać inne podejście do tej zagadki — oparte na rozważaniach dotyczących niezawodności sygnału i zaufania — patrz „od pantomimy do mowy” poniżej).

Kalendarium ewolucji mowy

Oś czasu hominina

-10 —

–

-9,5 —

–

-9 —

–

-8,5 —

–

-8 —

–

-7,5 —

–

-7 —

–

-6,5 —

–

-6 —

–

−5,5 —

–

-5 —

–

-4,5 —

–

-4 —

–

-3,5 —

–

-3 —

–

−2,5 —

–

-2 —

–

-1,5 —

–

-1 —

–

−0,5 —

–

0 —

miocen

pliocen

plejstocen

hominini

Nakalipithecus

Uranopitek

Oreopitek

Sahelanthropus

Orrorin

Ardipithecus

australopitek

Homo habilis

człowiek wyprostowany

Homo heidelbergensis

Homo sapiens

Neandertalczycy , denisowianie

←

Wcześniejsze małpy

←

Podział goryla

←

Szympans rozłam

←

Najwcześniejszy dwunożny

←

Narzędzia kamienne

←

Rozproszenie poza Afrykę

←

Najwcześniejszy ogień / gotowanie

←

Najwcześniejsze ubrania

←

Współcześni ludzie

H

o

m

i

n

i

d

s

( miliony lat temu )

Niewiele wiadomo o czasie pojawienia się języka u gatunku ludzkiego. W przeciwieństwie do pisma, mowa nie pozostawia materialnego śladu, przez co jest niewidoczna z punktu widzenia archeologii. Nie mając bezpośrednich dowodów językowych, specjaliści zajmujący się ludzkim pochodzeniem uciekli się do badania cech anatomicznych i genów prawdopodobnie związanych z produkcją mowy. Chociaż takie badania mogą dostarczyć informacji o tym, czy przednowoczesne gatunki Homo miały zdolność mowy , nadal nie wiadomo, czy rzeczywiście mówiły. Chociaż mogły komunikować się głosowo, dane anatomiczne i genetyczne nie mają rozdzielczości niezbędnej do odróżnienia prajęzyka od mowy.

Używając metod statystycznych do oszacowania czasu potrzebnego do osiągnięcia obecnego rozprzestrzenienia i różnorodności współczesnych języków współczesnych, Johanna Nichols — językoznawca z Uniwersytetu Kalifornijskiego w Berkeley — argumentowała w 1998 r., że języki wokalne musiały zacząć różnicować się w naszym gatunku co najmniej 100 000 lat temu.

Niedawno — w 2012 r. — antropolodzy Charles Perreault i Sarah Mathew wykorzystali różnorodność fonemiczną, aby zasugerować zgodną z tym datę. „Różnorodność fonemiczna” oznacza liczbę percepcyjnie odrębnych jednostek dźwiękowych — spółgłosek, samogłosek i tonów — w języku. Obecny światowy wzorzec różnorodności fonemicznej potencjalnie zawiera statystyczny sygnał ekspansji współczesnego Homo sapiens z Afryki, która rozpoczęła się około 60-70 tysięcy lat temu. Niektórzy uczeni twierdzą, że różnorodność fonemiczna ewoluuje powoli i może być używana jako zegar do obliczania, jak długo musiałyby istnieć najstarsze języki afrykańskie, aby zgromadzić liczbę posiadanych obecnie fonemów. Gdy populacje ludzkie opuściły Afrykę i rozszerzyły się na resztę świata, napotkały szereg wąskich gardeł – punktów, w których przetrwała tylko bardzo mała populacja, aby skolonizować nowy kontynent lub region. Podobno taki krach demograficzny doprowadził do odpowiedniego zmniejszenia różnorodności genetycznej, fenotypowej i fonemicznej. Języki afrykańskie mają dziś jedne z największych spisów fonemicznych na świecie, podczas gdy najmniejsze inwentarze znajdują się w Ameryce Południowej i Oceanii, jednych z ostatnich skolonizowanych regionów globu. Na przykład Rotokas , język Nowej Gwinei i Pirahã , używany w Ameryce Południowej, mają tylko 11 fonemów, podczas gdy !Xun , język używany w Afryce Południowej ma 141 fonemów. Autorzy wykorzystują naturalny eksperyment — kolonizację kontynentalnej Azji Południowo-Wschodniej z jednej strony, a od dawna izolowane Wyspy Andamańskie z drugiej — aby oszacować tempo wzrostu różnorodności fonemicznej w czasie. Stosując ten wskaźnik, szacują, że języki świata sięgają afrykańskiej środkowej epoki kamienia , od 350 tysięcy do 150 tysięcy lat temu. Odpowiada to specjacji, która dała początek Homo sapiens .

Te i podobne badania zostały jednak skrytykowane przez językoznawców, którzy twierdzą, że opierają się na błędnej analogii między genami a fonemami, ponieważ fonemy są często przenoszone poprzecznie między językami, w przeciwieństwie do genów, oraz na błędnym doborze języków świata, ponieważ zarówno Oceania, jak i Oceania Ameryki zawierają również języki o bardzo dużej liczbie fonemów, a Afryka zawiera języki o bardzo niewielu. Twierdzą, że faktyczny rozkład różnorodności fonemicznej na świecie odzwierciedla niedawny kontakt językowy, a nie głęboką historię języka – ponieważ dobrze wykazano, że języki mogą stracić lub zyskać wiele fonemów w bardzo krótkich okresach. Innymi słowy, nie ma uzasadnionego powodu językowego, aby oczekiwać, że genetyczny efekt założycielski wpłynie na różnorodność fonemiczną.

Scenariusze spekulacyjne

Wczesne spekulacje

„Nie mogę wątpić, że język zawdzięcza swój początek naśladowaniu i modyfikowaniu, wspomaganym znakami i gestami, różnych naturalnych dźwięków, głosów innych zwierząt i instynktownych okrzyków człowieka”.

— Charles Darwin, 1871. Pochodzenie człowieka i dobór w stosunku do płci.

W 1861 roku językoznawca historyczny Max Müller opublikował listę teorii spekulatywnych dotyczących pochodzenia języka mówionego: Teorie te zostały zgrupowane w kategorii zwanej hipotezami wynalazczymi. Wszystkie te hipotezy miały na celu zrozumienie, w jaki sposób mógł rozwinąć się pierwszy język, i postulowanie, że ludzka mimikra dźwięków naturalnych była sposobem wyprowadzania pierwszych słów o znaczeniu.

Łuk-łał . Teoria bow-wow lub kukułka , którą Müller przypisał niemieckiemu filozofowi Johannowi Gottfriedowi Herderowi , postrzegała wczesne słowa jako imitację krzyków zwierząt i ptaków. Teoria ta, uważana za wyprowadzoną z onomatopei, wiąże znaczenie dźwięku z rzeczywistym dźwiękiem sformułowanym przez mówiącego.
Puchatek . Teoria Puchatka-Puchatka postrzegała pierwsze słowa jako emocjonalne wtrącenia i okrzyki wywołane bólem, przyjemnością, zaskoczeniem i tak dalej. Wszystkie te dźwięki były wydawane przy nagłym wdechu, co jest niepodobne do żadnego innego języka. W przeciwieństwie do reakcji emocjonalnych, język mówiony jest wytwarzany na wydechu, więc dźwięki zawarte w tej formie komunikacji różnią się od tych używanych w normalnej produkcji mowy, co czyni tę teorię mniej prawdopodobną dla przyswajania języka.
Ding-dong . Müller zasugerował coś, co nazwał teorią Ding-Dong , która stwierdza, że wszystkie rzeczy mają wibrujący, naturalny rezonans, co zostało w jakiś sposób powtórzone przez człowieka w jego najwcześniejszych słowach. Słowa wywodzą się z dźwięku związanego z ich znaczeniem; na przykład „ uderzenie stało się słowem oznaczającym grzmot, huk – wybuch”. Teoria ta również w dużym stopniu opiera się na koncepcji onomatopei.
Yo-he-ho . Teoria jo-he-ho widziała język wyłaniający się z kolektywnej pracy rytmicznej, próba zsynchronizowania wysiłku mięśniowego skutkująca dźwiękami takimi jak falowanie na przemian z dźwiękami takimi jak ho . Uważa się, że wywodzi się z podstaw ludzkich wspólnych wysiłków, ta teoria głosi, że ludzie potrzebują do komunikowania się słów, które mogły zacząć się od intonowania. Ta potrzeba mogła mieć na celu odpędzanie drapieżników lub służyć jako jednoczący okrzyk bojowy.
Ta-ta . Nie znalazło się to na liście Maxa Müllera, zaproponowanej w 1930 roku przez Sir Richarda Pageta . Zgodnie z teorią ta-ta , ludzie tworzyli najwcześniejsze słowa poprzez ruchy języka, które naśladowały gesty manualne, czyniąc je słyszalnymi.

Obecna jest powszechna koncepcja onomatopei jako pierwszego źródła słów; jednak istnieje rażący problem z tą teorią. Onomatopeja może wyjaśnić pierwsze kilka słów, wszystkie wywodzące się ze zjawisk naturalnych, ale nie ma wyjaśnienia, jak powstały bardziej złożone słowa bez naturalnego odpowiednika. Większość dzisiejszych uczonych uważa, że wszystkie takie teorie nie są tak bardzo błędne – czasami oferują spostrzeżenia peryferyjne – jako komicznie naiwne i nieistotne. Problem z tymi teoriami polega na tym, że są one tak wąsko mechanistyczne. Zakładają, że gdy nasi przodkowie natknęli się na odpowiedni genialny mechanizm łączenia dźwięków ze znaczeniami, język automatycznie ewoluował i zmieniał się.

Problemy niezawodności i oszustwa

Z perspektywy współczesnej nauki główną przeszkodą w ewolucji komunikacji mowy w przyrodzie nie jest mechanistyczna. Chodzi raczej o to, że symbole — arbitralne skojarzenia dźwięków z odpowiadającymi im znaczeniami — są niewiarygodne i mogą być fałszywe. Jak to się mówi, „słowa są tanie”. Problem niezawodności nie został w ogóle dostrzeżony przez Darwina, Müllera czy innych wczesnych teoretyków ewolucjonizmu.

Sygnały głosowe zwierząt są w większości z natury niezawodne. Gdy kot mruczy, sygnał jest bezpośrednim dowodem zadowolenia zwierzęcia. Można „ufać” sygnałowi nie dlatego, że kot jest szczery, ale dlatego, że po prostu nie może sfałszować tego dźwięku. Głosy naczelnych mogą być nieco bardziej manipulowane, ale pozostają niezawodne z tego samego powodu — ponieważ trudno je sfałszować. Inteligencja społeczna naczelnych jest makiaweliczna — służąca sobie i nieskrępowana skrupułami moralnymi. Małpy i małpy człekokształtne często próbują oszukiwać się nawzajem, jednocześnie pozostając stale na straży, aby same nie padły ofiarą oszustwa. Paradoksalnie to właśnie odporność naczelnych na oszustwa blokuje ewolucję ich systemów komunikacji głosowej wzdłuż linii językowych. Język jest wykluczony, ponieważ najlepszym sposobem ochrony przed oszustwem jest ignorowanie wszystkich sygnałów z wyjątkiem tych, które można natychmiast zweryfikować. Słowa automatycznie nie przechodzą tego testu.

Słowa łatwo sfałszować. Jeśli okażą się kłamstwami, słuchacze dostosują się, ignorując je na rzecz trudnych do sfałszowania wskaźników lub wskazówek. Aby język działał, słuchacze muszą być pewni, że osoby, z którymi rozmawiają, zazwyczaj są uczciwe. Specyficzną cechą języka jest „przesunięte odniesienie”, czyli odniesienie do tematów spoza aktualnie dostrzegalnej sytuacji. Ta właściwość zapobiega potwierdzaniu wypowiedzi w bezpośrednim „tu” i „teraz”. Z tego powodu język zakłada stosunkowo wysoki poziom wzajemnego zaufania, aby z czasem stać się ewolucyjnie stabilną strategią . Teoria pochodzenia języka musi zatem wyjaśniać, dlaczego ludzie mogą zacząć ufać tanim sygnałom w sposób, w jaki inne zwierzęta najwyraźniej nie mogą (patrz teoria sygnalizacji ).

„Wybór rodu”

Hipoteza „języków ojczystych” została zaproponowana w 2004 roku jako możliwe rozwiązanie tego problemu. W. Tecumseh Fitch zasugerował, że częścią odpowiedzi może być darwinowska zasada „doboru krewniaczego” — zbieżność interesów genetycznych między krewnymi. Fitch sugeruje, że języki mówione były pierwotnie „językami ojczystymi”. Gdyby mowa wyewoluowała początkowo do komunikacji między matką a ich własnym biologicznym potomstwem, a później rozszerzyła się również na dorosłych krewnych, zainteresowania mówców i słuchaczy miałyby tendencję do pokrywania się. Fitch twierdzi, że wspólne interesy genetyczne doprowadziłyby do wystarczającego zaufania i współpracy, aby sygnały głosowe z natury niewiarygodne – słowa mówione – zostały zaakceptowane jako godne zaufania i zaczęły ewoluować po raz pierwszy.

Krytyka

Krytycy tej teorii wskazują, że dobór krewniaczy nie jest wyjątkowy dla ludzi. Matki małp człekokształtnych również dzielą geny ze swoim potomstwem, tak jak wszystkie zwierzęta, więc dlaczego tylko ludzie mówią? Co więcej, trudno uwierzyć, że wcześni ludzie ograniczyli komunikację językową do genetycznych krewnych: tabu kazirodztwa musiało zmusić mężczyzn i kobiety do interakcji i komunikowania się z osobami niebędącymi krewnymi. Zatem nawet jeśli przyjmiemy początkowe przesłanki Fitch, rozszerzenie rzekomych sieci „języka ojczystego” z krewnych na osoby niespokrewnione pozostaje niewyjaśnione.

„Wzajemny altruizm”

Ib Ulbæk odwołuje się do innej standardowej zasady darwinowskiej — „wzajemnego altruizmu” — aby wyjaśnić niezwykle wysoki poziom intencjonalnej uczciwości niezbędnej do ewolucji języka. „Wzajemny altruizm” można wyrazić jako zasadę, że jeśli podrapiesz mnie po plecach, ja podrapę twoje. W kategoriach językowych oznaczałoby to, że jeśli mówisz do mnie zgodnie z prawdą, ja mówię szczerze do Ciebie. Ulbæk podkreśla, że zwykły darwinowski altruizm wzajemny jest relacją nawiązaną między jednostkami, które często wchodzą w interakcje. Aby jednak język zwyciężył w całej społeczności, konieczna wzajemność musiałaby być egzekwowana powszechnie, zamiast pozostawiać ją indywidualnemu wyborowi. Ulbæk konkluduje, że aby język ewoluował, wczesne społeczeństwo jako całość musiało podlegać moralnej regulacji.

Krytyka

Krytycy zwracają uwagę, że teoria ta nie wyjaśnia, kiedy, jak, dlaczego i przez kogo „obowiązkowy wzajemny altruizm” mógł zostać narzucony. Zaproponowano różne propozycje usunięcia tej wady. Kolejną krytyką jest to, że język i tak nie działa w oparciu o wzajemny altruizm. Ludzie w grupach konwersacyjnych nie ukrywają informacji wszystkim poza słuchaczami, którzy mogą w zamian zaoferować cenne informacje. Wręcz przeciwnie, wydają się chcieć reklamować światu swój dostęp do istotnych społecznie informacji, udostępniając je każdemu, kto będzie słuchał, nie myśląc o powrocie.

„Plotki i uwodzenie”

Plotka, według Robina Dunbara , robi dla ludzi żyjących w grupie to samo, co ręczne pielęgnowanie innych naczelnych — pozwala jednostkom służyć swoim związkom, a tym samym utrzymywać sojusze. Gdy ludzie zaczęli żyć w coraz większych grupach społecznych, ręczne pielęgnowanie wszystkich przyjaciół i znajomych stało się tak czasochłonne, że stało się nieopłacalne. W odpowiedzi na ten problem ludzie wynaleźli „tanią i ultrawydajną formę pielęgnacji” — pielęgnację wokalną . Aby zadowolić sojuszników, wystarczyło tylko „przygotować” ich tanimi dźwiękami wokalnymi, obsługując jednocześnie wielu sojuszników, jednocześnie zachowując obie ręce wolne do innych zadań. Grooming wokalny (wytwarzanie przyjemnych dźwięków pozbawionych składni lub semantyki kombinatorycznej) przekształcił się w jakiś sposób w mowę syntaktyczną.

Krytyka

Krytycy tej teorii zwracają uwagę, że sama skuteczność „pielęgnacji wokalnej” — że słowa są tak tanie — podważyłaby jej zdolność do sygnalizowania zaangażowania, jakie daje czasochłonna i kosztowna pielęgnacja ręczna. Kolejną krytyką jest to, że teoria nie wyjaśnia kluczowego przejścia od uwodzenia wokalnego – wytwarzania przyjemnych, ale bezsensownych dźwięków – do złożoności poznawczej mowy syntaktycznej.

Od pantomimy do mowy

Według innej szkoły, język wyewoluował z mimesis — „odgrywania” scenariuszy z wykorzystaniem pantomimy wokalnej i gestykulacyjnej. Karol Darwin, który sam był sceptyczny, postawił hipotezę, że ludzka mowa i język wywodzą się z gestów i pantomimy ust. Teoria ta, dalej rozwijana przez różnych autorów, postuluje, że rodzaj Homo , inny niż nasi małpi przodkowie, wyewoluował nowy typ poznania. Małpy są zdolne do uczenia się skojarzeniowego. Potrafią powiązać bodziec czuciowy z reakcją motoryczną, często trenowaną przez warunkowanie klasyczne. Jednak u małp uwarunkowany sygnał sensoryczny jest niezbędny do ponownego zaobserwowania uwarunkowanej reakcji. Odpowiedź motoryczna nie wystąpi bez zewnętrznej wskazówki od zewnętrznego agenta. Niezwykłą umiejętnością, jaką posiadają ludzie, jest zdolność do dobrowolnego przywoływania wspomnień bez potrzeby podania wskazówki (np. bodźca warunkowego). Nie jest to zdolność obserwowana u zwierząt, z wyjątkiem małp wyszkolonych w języku. Nadal istnieje wiele kontrowersji, czy pantomima jest umiejętnością małp człekokształtnych, zarówno dzikich, jak i schwytanych. Dopóki wypowiedzi musiały być wyraziste emocjonalnie i przekonujące, przejście do znaków czysto konwencjonalnych nie było możliwe. Przy takim założeniu gesty i wokalizacje przedjęzykowe byłyby wymagane nie tylko do ujednoznacznienia zamierzonych znaczeń, ale także do wzbudzenia wiary w ich wewnętrzną wiarygodność. Gdyby zobowiązania umowne były konieczne, aby wzbudzić zaufanie całej społeczności do intencji komunikacyjnych, wynikałoby z tego, że musiały one zostać wprowadzone, zanim ludzie mogliby w końcu przejść na ultrawydajną, szybką – cyfrową, a nie analogową – sygnalizację. format. Wokalne cechy charakterystyczne (kontrasty dźwiękowe) są do tego idealne. Sugeruje się zatem, że ustanowienie porozumień kontraktowych umożliwiło zdecydowane przejście od gestu mimetycznego do w pełni skonwencjonalizowanej, cyfrowo zakodowanej mowy.

„Koewolucja rytuału/mowy”

Teoria koewolucji rytuału/mowy została pierwotnie zaproponowana przez wybitnego antropologa społecznego Roya Rappaporta, zanim została opracowana przez antropologów takich jak Chris Knight, Jerome Lewis, Nick Enfield, Camilla Power i Ian Watts. Innym wybitnym zwolennikiem tego ogólnego podejścia jest kognitywista i inżynier robotyki Luc Steels, podobnie jak biologiczny antropolog/neurobiolog Terrence Deacon .

Uczeni ci twierdzą, że nie może istnieć coś takiego jak „teoria pochodzenia języka”. Dzieje się tak dlatego, że język nie jest odrębną adaptacją, ale wewnętrznym aspektem czegoś znacznie szerszego — a mianowicie ludzkiej kultury symbolicznej jako całości. Próby wyjaśnienia języka niezależnie od tego szerszego kontekstu spektakularnie się nie powiodły, twierdzą ci naukowcy, ponieważ rozwiązują problem bez rozwiązania. Czy możemy sobie wyobrazić historyka próbującego wyjaśnić pojawienie się kart kredytowych niezależnie od szerszego systemu, którego są częścią? Używanie karty kredytowej ma sens tylko wtedy, gdy masz konto bankowe, które jest instytucjonalnie uznawane przez pewien rodzaj zaawansowanego społeczeństwa kapitalistycznego – takiego, w którym technologia komunikacyjna została już wynaleziona i można wykrywać oszustwa i im zapobiegać. W podobny sposób język nie działałby poza określonym zestawem mechanizmów i instytucji społecznych. Na przykład nie zadziałałoby to w przypadku małp komunikujących się z innymi małpami na wolności. Nawet najmądrzejsza małpa nie byłaby w stanie sprawić, by język działał w takich warunkach.

„Kłamstwo i alternatywa, nieodłącznie związane z językiem… stwarzają problemy każdemu społeczeństwu, którego struktura opiera się na języku, czyli wszystkich społeczeństwach ludzkich. Słowo i że Słowo jest ustanowione przez niezmienność liturgii”.

Zwolennicy tej szkoły myślenia zwracają uwagę, że słowa są tanie. Jako halucynacje cyfrowe są z natury niewiarygodne. Gdyby wyjątkowo sprytna małpa lub nawet grupa małp człekokształtnych próbowała używać słów na wolności, nie byłyby przekonane. Wokalizacje naczelnych, które niosą ze sobą przekonanie — te, których faktycznie używają — są niepodobne do słów, ponieważ są emocjonalnie ekspresyjne, wewnętrznie znaczące i wiarygodne, ponieważ są stosunkowo kosztowne i trudne do sfałszowania.

Mowa składa się z cyfrowych kontrastów, których koszt jest zasadniczo zerowy. Jako czysto społeczne konwencje tego rodzaju sygnały nie mogą ewoluować w darwinowskim świecie społecznym — są teoretyczną niemożliwością. Będąc z natury niewiarygodnym, język działa tylko wtedy, gdy można zbudować reputację osoby godnej zaufania w pewnym rodzaju społeczeństwa – mianowicie takiego, w którym symboliczne fakty kulturowe (czasami nazywane „faktami instytucjonalnymi”) mogą być ustalane i utrzymywane poprzez zbiorową aprobatę społeczną. W każdym społeczeństwie zbieracko-łowieckim podstawowym mechanizmem budowania zaufania do symbolicznych faktów kulturowych jest zbiorowy rytuał . Dlatego zadanie stojące przed badaczami początków języka jest bardziej multidyscyplinarne, niż się zwykle przypuszcza. Polega ona na zajęciu się ewolucyjnym wyłanianiem się ludzkiej kultury symbolicznej jako całości, przy czym język jest ważnym, ale pomocniczym składnikiem.

Krytyka

Do krytyków tej teorii należy Noam Chomsky , który nazywa ją hipotezą „nieistnienia” — zaprzeczeniem samego istnienia języka jako przedmiotu badań nauk przyrodniczych. Własna teoria Chomsky'ego głosi, że język pojawił się w jednej chwili iw doskonałej formie, co skłoniło jego krytyków do riposty, że tylko coś, co nie istnieje — konstrukt teoretyczny lub wygodna fikcja naukowa — może wyłonić się w tak cudowny sposób. Kontrowersje pozostają nierozwiązane.

Spekulacje XX wieku

Początki świąteczne

Esej „Święte pochodzenie ludzkiej mowy”, choć opublikowany pod koniec XIX wieku, wywarł niewielki wpływ, dopóki amerykańska filozofka Susanne Langer nie odkryła go ponownie i opublikowała w 1941 roku.

„We wczesnej historii wyartykułowanych dźwięków same nie mogły nadawać żadnego znaczenia, ale zachowały się i ściśle kojarzyły się z osobliwymi uczuciami i percepcją, które najbardziej wpłynęły do umysłów uczestników festiwalu podczas ich podniecenia”.

— J. Donovan, 1891. Świąteczne pochodzenie ludzkiej mowy.

Teoria ta opiera się na obserwacji, że głosy wokalne naczelnych mają przede wszystkim ekspresję emocjonalną . Wzbudzane emocje są społecznie zaraźliwe. Z tego powodu przedłużający się atak krzyków, pohukiwania lub szczekania będzie miał tendencję do wyrażania nie tylko uczuć tej lub innej osoby, ale wzajemnie zaraźliwych wzlotów i upadków wszystkich w zasięgu słuchu.

Wracając do przodków Homo sapiens , teoria „festialnego pochodzenia” sugeruje, że w „podnieceniu zabawą” poprzedzającym lub po wspólnym polowaniu lub innej działalności grupowej, każdy mógł połączyć swoje głosy w porównywalny sposób, podkreślając swój nastrój wspólnoty. z takimi odgłosami jak rytmiczne bębnienie i klaskanie w dłonie. Głosy o różnej tonacji utworzyłyby konwencjonalne wzorce, tak że śpiew chóralny stałby się integralną częścią wspólnego świętowania.

Chociaż nie była to jeszcze mowa, według Langera rozwinęła zdolności wokalne, z których później wywodzi się mowa. Istniałyby konwencjonalne sposoby uwoływania, klaskania lub tańczenia odpowiednie do różnych świąt, z których każdy był tak ściśle związany z tym rodzajem okazji , że miałby tendencję do wspólnego podtrzymywania i ucieleśniania koncepcji tego. Każdy, kto usłyszy urywek z takiej piosenki, przypomni sobie związaną z tym okazję i nastrój. Melodyjna, rytmiczna sekwencja sylab umownie kojarzona z określonym rodzajem celebracji stałaby się w efekcie jej wokalnym znakiem. Na tej podstawie pewne znajome sekwencje dźwiękowe stałyby się „symboliczne”.

Na poparcie tego wszystkiego Langer przytacza raporty etnograficzne o pieśniach plemiennych składających się wyłącznie z „rytmicznych sylab nonsensownych”. Przyznaje, że angielski odpowiednik, taki jak „hej-nonny-nonny”, chociaż może sugerować pewne uczucia lub idee, nie jest ani rzeczownikiem, czasownikiem, przymiotnikiem, ani żadną inną składniową częścią mowy. Dopóki wyartykułowany dźwięk służył jedynie jako „hej nonny-nonny”, „hallelujah” czy „aack-a-day”, nie mógł jeszcze być mową. Aby tak się stało, zdaniem Langera konieczne było, aby takie sekwencje były emitowane coraz bardziej poza kontekstem — poza ogólną sytuacją, która je zrodziła. Sekretem metafory jest rozszerzenie zbioru skojarzeń z jednego kontekstu poznawczego na inny, zupełnie inny . Langer przywołuje wczesną wersję tego, co obecnie nazywa się „teorią gramatyki”, aby pokazać, w jaki sposób z takiego punktu wyjścia mogła stopniowo powstać mowa syntaktycznie złożona.

Langer przyznaje, że Emile Durkheim zaproponował uderzająco podobną teorię już w 1912 roku. Aby zapoznać się z niedawnymi myślami w podobnym tonie, patrz Steven Brown o „języku muzyki”, Chris Knight o „rytuale” i „zabawa”, Jerome Lewis o „naśladowaniu”, Steven Mithen o „Hmmmmm” Bruce Richman o „bezsensownych sylabach” i Alison Wray o „holistycznym protojęzyku”.

Hipoteza neuronów lustrzanych (MSH) i motoryczna teoria percepcji mowy

Neurony lustrzane, pierwotnie znalezione u makaków, są neuronami, które są aktywowane zarówno u wykonawcy akcji, jak i obserwatora akcji. Jest to proponowany mechanizm u ludzi.

Hipoteza neuronów lustrzanych, oparta na zjawisku odkrytym w 2008 roku przez Rizzolatti i Fabbri, wspiera motoryczną teorię percepcji mowy. Motoryczna teoria percepcji mowy została zaproponowana w 1967 roku przez Libermana, który uważał, że system motoryczny i systemy językowe są ze sobą ściśle powiązane. Spowodowałoby to bardziej uproszczony proces generowania mowy; zarówno poznanie, jak i sformułowanie mowy może zachodzić jednocześnie. Zasadniczo marnotrawstwem jest posiadanie niezależnego od siebie procesu dekodowania i kodowania mowy. Ta hipoteza została dodatkowo poparta odkryciem neuronów ruchowych. Rizzolatti i Fabbri stwierdzili, że w korze ruchowej makaków znajdują się specyficzne neurony, które aktywowały się na widok działania. Aktywowane neurony to te same neurony, w których same musiałyby wykonać tę samą akcję. Neurony lustrzane uruchamiają się podczas obserwacji i wykonywania czynności, co wskazuje, że neurony znajdujące się w korze ruchowej są niezbędne do zrozumienia procesu wzrokowego. Obecność neuronów lustrzanych może wskazywać, że niewerbalna komunikacja gestami jest znacznie starsza niż wcześniej sądzono. Motoryczna teoria percepcji mowy opiera się na zrozumieniu reprezentacji motorycznych leżących u podstaw gestów mowy, takich jak ruch warg. Obecnie nie ma jasnego zrozumienia percepcji mowy, ale ogólnie przyjmuje się, że kora ruchowa jest aktywowana w percepcji mowy do pewnego stopnia.

„Muzykojęzyk”

Termin „musilanguage” (lub „hmmmmm”) odnosi się do przedjęzykowego systemu komunikacji głosowej, z którego (według niektórych badaczy) wywodzi się zarówno muzyka, jak i język. Chodzi o to, że rytmiczny, melodyjny, emocjonalnie ekspresyjny rytuał wokalny pomógł zawiązać koalicje i, z biegiem czasu, wytworzyć presję selekcyjną w celu zwiększenia wolicjonalnej kontroli nad artykulatorami mowy. Wyobraża się, że wzorce zsynchronizowanego śpiewu chóralnego zmieniały się w zależności od okazji. Na przykład „wyruszamy na poszukiwanie miodu” może brzmieć jakościowo inaczej niż „wyruszamy na polowanie” lub „ opłakujemy śmierć naszego krewnego”. Gdyby pozycja społeczna zależała od utrzymywania regularnego rytmu i harmonizowania własnego głosu z głosem wszystkich innych, członkowie grupy znajdowaliby się pod presją, by zademonstrować swoje umiejętności chóralne.

Archaeologist Steven Mithen przypuszcza neandertalczyków posiadał pewną takiego systemu, wyrażając się w "język" znany jako "Hmmmmm" odstaniu H olistic, m anipulative, m ulti- m Odal, m usical i m imetic. ^{P. 169-175} We wcześniejszej wersji Bruce'a Richmana, zasadniczo tego samego pomysłu, częste powtarzanie tych samych kilku piosenek wieloma głosami ułatwiało ludziom zapamiętanie tych sekwencji jako całych jednostek. Czynności, które grupa ludzi wykonywała podczas wspólnego wokalizowania — czynności, które były ważne, uderzające lub bogate w emocje — zaczęły być kojarzone z określonymi sekwencjami dźwiękowymi, tak że za każdym razem, gdy słyszany fragment, wywoływał bardzo specyficzne wspomnienia. Chodzi o to, że najwcześniejsze pozycje leksykalne (słowa) zaczynały się jako skrócone fragmenty tego, co pierwotnie były pieśniami wspólnotowymi.

„Za każdym razem, gdy ludzie śpiewali lub skandowali konkretną sekwencję dźwiękową, pamiętali konkretne szczegóły sytuacji najsilniej z nią związane: ach, tak! śpiewamy to podczas tego szczególnego rytuału, dopuszczając nowych członków do grupy; lub śpiewamy to podczas długa podróż w lesie; albo, kiedy kończy się polana dla nowego obozu, to właśnie śpiewamy; albo takie zawodzenia śpiewamy podczas ceremonii nad zmarłymi członkami naszej grupy.

— Richman, B. 2000. Jak muzyka utrwala „bzdury” w znaczące formuły: rytm, powtórzenie i znaczenie. W NL Wallin, B. Merker i S. Brown (red.), The Origins of Music: Wprowadzenie do muzykologii ewolucyjnej. Cambridge, Massachusetts: MIT Press, s. 301-314.

Gdy członkowie grupy gromadzili rosnący repertuar piosenek na różne okazje, wzorce interpersonalnych połączeń i odpowiedzi ewoluowały wzdłuż jednej trajektorii, aby przybrać formę językową. W międzyczasie śpiew polifoniczny i inne rodzaje muzyki stawały się coraz bardziej wyspecjalizowane i wyrafinowane, podążając rozbieżną trajektorią.

Aby wyjaśnić powstanie mowy syntaktycznej, Richman cytuje angielskie „I wanna go home”. Wyobraża sobie, że nauczył się tego na początku nie jako kombinatoryczna sekwencja wolno stojących słów, ale jako pojedyncza, sklejona ze sobą kombinacja – melodyjny dźwięk, który ludzie wydają, by wyrazić „tęsknotę za domem”. Ktoś może śpiewać „Chcę iść do domu”, podpowiadając innym głosom „Muszę iść do domu”, „Chciałbym iść do domu”, „Wracajmy do domu” i tak dalej. Zauważ, że jedna część utworu pozostaje stała, podczas gdy inna może się zmieniać. Jeśli ta teoria zostanie zaakceptowana, syntaktycznie złożona mowa zaczęła ewoluować, ponieważ każda intonowana mantra pozwalała na zmianę w pewnym momencie, pozwalając na wstawienie elementu z innej piosenki. Na przykład podczas żałoby podczas obrzędu pogrzebowego ktoś może chcieć przywołać wspomnienie zbierania miodu ze zmarłym, sygnalizując to w odpowiednim momencie fragmentem piosenki „zbieramy miód”. Wyobraź sobie, że takie praktyki stały się powszechne. Wypowiedzi obciążone znaczeniami zostałyby teraz poddane specyficznej językowej zasadzie twórczej — zasadzie osadzania rekurencyjnego.

Egalitaryzm łowców-zbieraczy

Mbendjele dzielenie się mięsem myśliwego-zbieracza

Wielu uczonych kojarzy ewolucyjne pojawienie się mowy z głębokim rozwojem społecznym, seksualnym, politycznym i kulturowym. Jeden pogląd głosi, że dominacja w stylu naczelnych musiała ustąpić miejsca bardziej kooperatywnemu i egalitarnemu stylowi życia, charakterystycznemu dla współczesnych łowców-zbieraczy.

Intersubiektywność

Według Michaela Tomasello kluczową zdolnością poznawczą odróżniającą Homo sapiens od naszych małpich kuzynów jest „ intersubiektywność ”. Pociąga to za sobą zmianę i odwrócenie ról: twój partner stara się czytać w twoich myślach, ty jednocześnie starasz się czytać ich, a każdy z was podejmuje świadomy wysiłek, aby pomóc drugiemu w tym procesie. Rezultat jest taki, że każdy z partnerów tworzy reprezentację umysłu drugiej osoby, w której poprzez refleksję można rozpoznać swój własny.

Tomasello twierdzi, że tego rodzaju dwukierunkowe poznanie jest kluczowe dla samej możliwości komunikacji językowej. Opierając się na swoich badaniach zarówno z dziećmi, jak i szympansami, donosi, że ludzkie niemowlęta, począwszy od pierwszego roku życia, zaczynają patrzeć na swój umysł jakby z punktu widzenia innych. Określa to jako rewolucję poznawczą. Szympansy, dorastając, nigdy nie przechodzą takiej rewolucji. Wyjaśnienie, według Tomasello, jest takie, że ich rozwinięta psychologia jest przystosowana do głęboko konkurencyjnego stylu życia. Dziko żyjące szympansy z despotycznych hierarchii społecznych, większość interakcji obejmuje obliczenia dominacji i uległości. Dorosły szympans będzie starał się przechytrzyć swoich rywali, odgadując ich intencje, jednocześnie blokując im odwzajemnienie. Ponieważ dwukierunkowa komunikacja intersubiektywna jest w takich warunkach niemożliwa, zdolności poznawcze niezbędne dla języka nie ewoluują.

Kontrdominacja

W scenariuszu preferowanym przez Davida Erdala i Andrew Whitena dominacja w stylu prymasów wywołała równy i przeciwny opór koalicyjny — kontrdominację. W toku ewolucji człowieka coraz skuteczniejsze strategie buntu przeciwko dominującym jednostkom prowadziły do kompromisu. Porzucając wszelkie próby dominacji nad innymi, członkowie grupy energicznie podkreślali swoją osobistą autonomię, utrzymując sojusze, aby potencjalnie dominujące jednostki zastanowiły się dwa razy. W ramach coraz bardziej stabilnych koalicji, zgodnie z tą perspektywą, status zaczął być zdobywany w nowatorski sposób, nagrody społeczne przyznawane tym, którzy postrzegani są przez rówieśników jako szczególnie chętni do współpracy i świadomi siebie.

Odwrócona dominacja

Podczas gdy kontrdominacja, zgodnie z tą ewolucyjną narracją, kończy się impasem, antropolog Christopher Boehm rozwija logikę o krok dalej. Kontrdominacja w końcu przeradza się w pełnowymiarową „odwróconą dominację”. Zbuntowana koalicja zdecydowanie obala postać prymasa samca alfa. Żadna dominacja nie jest dozwolona poza dominacją samoorganizującej się społeczności jako całości.

W wyniku tej zmiany społecznej i politycznej powstaje egalitaryzm łowiecko-zbieracki. Gdy dzieci dorastają, osoby wokół nich motywują je do odwracania perspektywy, angażowania innych umysłów na wzór ich własnego modelu. Naciski selekcyjne sprzyjają takim innowacjom psychologicznym, jak wyobrażeniowa empatia, wspólna uwaga, osąd moralny, współpraca zorientowana na projekt oraz umiejętność oceny własnego zachowania z punktu widzenia innych. Opierając się na zwiększonych prawdopodobieństwach transmisji kulturowej i kumulacyjnej ewolucji kulturowej, osiągnięcia te doprowadziły do ustanowienia egalitaryzmu w stylu łowcy-zbieraczy w połączeniu z intersubiektywną komunikacją i poznaniem. To w tym społecznym i politycznym kontekście rozwija się język.

Scenariusze obejmujące interakcje matka-dziecko

„Odkładanie dziecka”

Zgodnie z teorią „odkładania dziecka” Deana Falka, interakcje głosowe między wczesnymi matkami homininami a niemowlętami wywołały sekwencję wydarzeń, które ostatecznie doprowadziły do najwcześniejszych słów naszych przodków. Podstawowym założeniem jest to, że ewoluujące ludzkie matki, w przeciwieństwie do ich małpich i małpich odpowiedników, nie mogą poruszać się i żerować z niemowlętami uczepionymi ich pleców. Utrata sierści w przypadku ludzi sprawiała, że niemowlęta nie mogły się przyczepić. Często więc matki musiały odkładać swoje dzieci. W rezultacie te dzieci potrzebowały zapewnienia, że nie są porzucane. Matki odpowiedziały, rozwijając „matczycę” — kierowany przez niemowlęta system komunikacji, obejmujący mimikę twarzy, mowę ciała, dotykanie, poklepywanie, pieszczoty, śmiech, łaskotanie i emocjonalnie ekspresyjne rozmowy kontaktowe. Argumentem jest, że język jakoś rozwinął się z tego wszystkiego.

Krytyka

Chociaż ta teoria może wyjaśniać pewien rodzaj kierowanego przez niemowlęta „protojęzyka” — znanego dziś jako „matczyny” — nie rozwiązuje naprawdę trudnego problemu, jakim jest pojawienie się wśród dorosłych mowy syntaktycznej.

Hodowla spółdzielcza

Antropolożka ewolucyjna Sarah Hrdy zauważa, że tylko ludzkie matki wśród małp człekokształtnych są skłonne pozwolić innemu osobnikowi przejąć własne dzieci; co więcej, rutynowo pozwalamy innym opiekować się dzieckiem. Jako główny czynnik powstrzymujący matki szympansów, bonobo czy goryle przed robieniem tego samego, uważa brak zaufania : „Jeśli matki małp nalegają na noszenie dzieci wszędzie… dzieje się tak dlatego, że dostępne alternatywy nie są wystarczająco bezpieczne”. Podstawowym problemem jest to, że matki małp (w przeciwieństwie do matek małp, które często opiekują się dzieckiem) nie mają w pobliżu krewnych. Silną implikacją jest to, że w trakcie ewolucji Homo mogła rozwinąć się allocare, ponieważ matki Homo miały blisko żeńskich krewnych — przede wszystkim, najbardziej niezawodnie, ich własne matki. Rozszerzając hipotezę babci , Hrdy twierdzi, że ewoluujące samice Homo erectus z konieczności początkowo opierały się na żeńskich krewniakach; ta nowa sytuacja w małpiej ewolucji matki, niemowlęcia i matki matki jako alokatorki stworzyła ewolucyjny grunt dla pojawienia się intersubiektywności. Relacjonuje ten początek „wspólnego rozmnażania u małpy” ze zmianami w historii życia i wolniejszym rozwojem dziecka, związanymi ze zmianą wielkości mózgu i ciała od 2 milionów lat.

Prymatolog Klaus Zuberbühler wykorzystuje te pomysły, aby wyjaśnić pojawienie się elastyczności głosu u gatunku ludzkiego. Wspólne rozmnażanie zmusiłoby niemowlęta do aktywnej walki o zwrócenie uwagi opiekunów, z których nie wszyscy byliby bezpośrednio spokrewnieni. Podstawowy repertuar sygnałów głosowych naczelnych mógł być niewystarczający dla tego społecznego wyzwania. Zgodnie z tym poglądem dobór naturalny faworyzowałby dzieci z zaawansowanymi umiejętnościami głosowymi, zaczynając od gaworzenia (co wywołuje pozytywne reakcje u opiekunów) i torując drogę dla skomplikowanych i unikalnych zdolności mowy współczesnych ludzi.

Czy „mama” było pierwszym słowem?

Te idee mogą być powiązane z pomysłami znanego językoznawcy strukturalnego Romana Jakobsona, który twierdził, że „czynnościom ssania dziecka towarzyszy lekki szmer nosowy, jedyna fonacja, która powstaje, gdy usta są przyciśnięte do piersi matki… …a usta są pełne”. Zaproponował, że w późniejszym okresie rozwoju niemowlęcia „ta fonacyjna reakcja na karmienie jest odtwarzana jako sygnał wyprzedzający na sam widok jedzenia i wreszcie jako przejaw pragnienia jedzenia, czy szerzej jako wyraz niezadowolenia i niecierpliwej tęsknoty”. za brakujące jedzenie lub nieobecność pielęgniarki i wszelkie niezasłużone życzenie." Tak więc czynność otwierania i zamykania ust, połączona z wydawaniem dźwięku przez nos przy zamkniętych ustach, dała sekwencję dźwiękową „Mama”, która może być zatem liczona jako pierwsze słowo. Peter MacNeilage ze współczuciem omawia tę teorię w swojej głównej książce The Origin of Speech , łącząc ją z teorią Deana Falka o „porzucaniu dziecka” (patrz wyżej). Nie trzeba dodawać, że inni badacze sugerowali zupełnie innych kandydatów na pierwsze słowo Homo sapiens .

Teoria budowy nisz

Tama bobra na Ziemi Ognistej. Bobry dostosowują się do niszy środowiskowej, którą kształtują własną działalnością.

Podczas gdy wydział języka biologicznego jest dziedziczony genetycznie, rzeczywiste języki lub dialekty są przekazywane kulturowo, podobnie jak normy społeczne, tradycje technologiczne i tak dalej. Biolodzy oczekują solidnej koewolucyjnej trajektorii łączącej ewolucję genetyczną człowieka z ewolucją kultury. Osoby zdolne do podstawowych form prajęzyka miałyby lepszy dostęp do zrozumienia kulturowego, podczas gdy te przekazywane w sposób, którego młode mózgi mogłyby łatwo nauczyć się, byłyby z kolei przekazywane z coraz większą skutecznością.

W pewnym sensie, podobnie jak bobry, budując tamy, ludzie zawsze angażowali się w budowę nisz , tworząc nowe środowiska, do których później się przystosowują. Presje selekcyjne związane z wcześniejszymi niszami mają tendencję do rozluźniania się, ponieważ ludzie w coraz większym stopniu polegają na nowych środowiskach tworzonych w sposób ciągły przez ich własną działalność produkcyjną. Według Stevena Pinkera język jest adaptacją do „niszy poznawczej”. W wariacjach na temat koewolucji rytualnej/mowy — zgodnie z którą mowa ewoluowała do celów komunikacji wewnętrznej w ramach rytualnie skonstruowanej domeny — starano się dokładniej określić, kiedy, dlaczego i w jaki sposób ta szczególna nisza została stworzona przez ludzką współpracę.

Ramy koncepcyjne

Strukturalizm

„Pomyśl o rycerzu w szachach. Czy bierka sama w sobie jest elementem gry? Z pewnością nie. Bo jako przedmiot materialny, oddzielony od swojego pola na szachownicy i innych warunków gry, nie ma znaczenia dla gracza. Staje się realnym, konkretnym elementem dopiero wtedy, gdy nabierze lub utożsamia się ze swoją wartością w grze. Załóżmy, że podczas gry ten element zostanie zniszczony lub zgubiony. Czy można go zastąpić? Oczywiście, że tak. Nie tylko przez jakiś inny skoczek, ale nawet przez przedmiot o zupełnie innym kształcie, który można zaliczyć do skoczka, pod warunkiem, że ma taką samą wartość jak brakujący element."

— de Saussure, F. (1983) [1916]. Kurs Językoznawstwa Ogólnego . Przetłumaczone przez R. Harrisa. Londyn: Duckworth. s. 108–09.

Szwajcarski uczony Ferdinand de Saussure założył lingwistykę jako dwudziestowieczną dyscyplinę zawodową. Saussure uważał język za system rządzony przez reguły, podobnie jak gra planszowa, taka jak szachy. Aby zrozumieć szachy, podkreślał, musimy zignorować takie czynniki zewnętrzne, jak pogoda panująca podczas danej sesji czy materiałowy skład tego czy innego utworu. Gra jest autonomiczna w odniesieniu do swoich materialnych wcieleń. W ten sam sposób, studiując język, należy skupić się na jego wewnętrznej strukturze jako instytucji społecznej. Sprawy zewnętrzne ( np . kształt ludzkiego języka) są z tego punktu widzenia nieistotne. Saussure uważał „mówienie” (parole) za indywidualne, pomocnicze i mniej lub bardziej przypadkowe w porównaniu z „językiem” (langue) , który uważał za zbiorowy, systematyczny i niezbędny.

Saussure wykazał niewielkie zainteresowanie teorią ewolucji Darwina drogą doboru naturalnego. Nie uważał też za warte zastanowienia się nad tym, jak język mógł pierwotnie ewoluować. Założenia Saussure'a w rzeczywistości poddają w wątpliwość słuszność wąsko pojętych scenariuszy pochodzenia. Jego paradygmat strukturalistyczny, przyjęty w swojej pierwotnej formie, zwraca uwagę badaczy na szerszy problem: w jaki sposób nasz gatunek nabył zdolność do ustanawiania instytucji społecznych w ogóle.

Behawioryzm

„Podstawowe procesy i relacje, które nadają zachowaniom werbalnym jego szczególne cechy, są obecnie dość dobrze zrozumiane. Wiele prac eksperymentalnych odpowiedzialnych za ten postęp przeprowadzono na innych gatunkach, ale wyniki okazały się zaskakująco wolne od ograniczeń gatunkowych. praca wykazała, że metody można rozszerzyć na ludzkie zachowanie bez poważnych modyfikacji”.

— Skinner, BF (1957). Zachowanie werbalne . Nowy Jork: Appleton Century Crofts. P. 3.

W Stanach Zjednoczonych, przed i bezpośrednio po II wojnie światowej, dominującym paradygmatem psychologicznym był behawioryzm . W tych ramach koncepcyjnych język był postrzegany jako pewien rodzaj zachowania — mianowicie zachowanie werbalne, które należy badać podobnie jak każdy inny rodzaj zachowania w świecie zwierząt. Raczej jak szczur laboratoryjny uczy się, jak odnaleźć drogę przez sztuczny labirynt, tak ludzkie dziecko uczy się werbalnych zachowań społeczeństwa, w którym się urodziło. Złożoność fonologiczna, gramatyczna i inne zawiłości mowy są w tym sensie zjawiskami „zewnętrznymi”, wpisanymi w początkowo nieustrukturyzowany mózg. Pojawienie się języka w Homo sapiens z tej perspektywy nie stanowi specjalnego wyzwania teoretycznego. Ludzkie zachowanie, zarówno werbalne, jak i inne, ilustruje plastyczną naturę mózgu ssaków, a zwłaszcza człowieka.

Chomskiański natywizm

Modułowość umysłu to idea, która była zapowiedzią w niektórych aspektach przez ruch 19-wiecznej frenologia .

Natywizm to teoria, że ludzie rodzą się z pewnymi wyspecjalizowanymi modułami poznawczymi , które umożliwiają nam przyswajanie bardzo złożonych zasobów wiedzy, takich jak gramatyka języka.

„Istnieje długa historia badań nad pochodzeniem języka, pytających, w jaki sposób powstał on z nawoływań małp itp. To badanie jest moim zdaniem całkowitą stratą czasu, ponieważ język opiera się na zupełnie innej zasadzie niż jakakolwiek komunikacja zwierzęca system."

— Chomsky, N. (1988). Język i problemy wiedzy . Cambridge, Massachusetts: MIT Press. P. 183.

Od połowy lat pięćdziesiątych Noam Chomsky , Jerry Fodor i inni montowali coś, co konceptualizowali jako „rewolucję” przeciwko behawioryzmowi. Z perspektywy czasu nazwano to „ rewolucją kognitywną ”. Podczas gdy behawioryzm zaprzeczył naukowej ważności koncepcji „umysłu”, Chomsky odpowiedział, że w rzeczywistości koncepcja „ciała” jest bardziej problematyczna. Behawioryści mieli tendencję do postrzegania mózgu dziecka jako tabula rasa , początkowo pozbawionego struktury lub treści poznawczych. Według BF Skinnera, na przykład, bogactwo szczegółów behawioralnych (zarówno werbalnych, jak i niewerbalnych) emanowało ze środowiska. Chomsky postawił ten pomysł na głowie. Środowisko językowe, z jakim spotyka się małe dziecko, zgodnie z wersją psychologicznego natywizmu Chomsky'ego , jest w rzeczywistości beznadziejnie nieodpowiednie. Żadne dziecko nie mogłoby nabyć zawiłości gramatycznych z tak ubogiego źródła. Daleki od postrzegania języka jako całkowicie zewnętrznego, Chomsky przekonceptualizował go jako całkowicie wewnętrzny. Aby wyjaśnić, w jaki sposób dziecko tak szybko i bez wysiłku przyswaja swój język ojczysty, nalegał, musimy dojść do wniosku, że przychodzi na świat z już zainstalowanymi podstawami gramatyki. Żaden inny gatunek, według Chomsky'ego, nie jest genetycznie wyposażony w zdolność językową – ani w rzeczy samej, w cokolwiek podobnego. Pojawienie się takiego wydziału u Homo sapiens z tego punktu widzenia stawia nauki biologiczne przed poważnym wyzwaniem teoretycznym.

Teoria aktów mowy

Jednym ze sposobów wyjaśnienia złożoności biologicznej jest odniesienie do jej wywnioskowanej funkcji. Według wpływowego filozofa Johna Austina podstawowa funkcja mowy jest aktywna w świecie społecznym.

Akty mowy , zgodnie z tym korpusem teorii, mogą być analizowane na trzech różnych poziomach: elokucyjnym, illokucyjnym i perlokucyjnym. Czyn jest słowny, gdy postrzega się go jako wydawanie pewnych dźwięków językowych — na przykład ćwiczenie poprawnej wymowy w języku obcym. Czyn jest illokucją o tyle, o ile stanowi interwencję we wspólnie postrzegany lub rozumiany świat. Obiecywanie, małżeństwo, rozwód, deklarowanie, stwierdzanie, autoryzacja, ogłaszanie i tak dalej są aktami mowy w tym illokucyjnym sensie. Czyn jest perlokucyjny, gdy patrzy się na niego z punktu widzenia jego bezpośredniego psychologicznego wpływu na publiczność. Przestraszenie dziecka mówiąc „Buu!” byłby przykładem aktu „perlokucyjnego”.

Dla Austina „robienie rzeczy” słowami oznacza przede wszystkim użycie siły illokucji . Sekretem tego jest udział społeczności lub zmowa. Musi istnieć „prawidłowa” (konwencjonalnie uzgodniona) procedura, a wszyscy zainteresowani muszą zaakceptować, że była ona właściwie przestrzegana.

„Jednym z naszych przykładów było, na przykład, wypowiedź „tak” (weź tę kobietę za moją prawowitą żonę), wypowiadaną podczas ceremonii ślubnej. Powinniśmy tu powiedzieć, że wypowiadając te słowa, czynimy coś — mianowicie poślubienie, zamiast zgłaszania czegoś, a mianowicie, że się pobieramy”.

— Austin, JL (1962). Jak robić rzeczy za pomocą słów . Oksford: Oxford University Press. s. 12–13.

W przypadku księdza deklarującego małżeństwo jako męża i żonę, jego słowa będą miały moc illokucyjną tylko wtedy, gdy jest on odpowiednio upoważniony i tylko wtedy, gdy ceremonia zostanie właściwie przeprowadzona, przy użyciu słów uznanych za odpowiednie do okoliczności. Austin wskazuje, że gdyby ktokolwiek próbował ochrzcić pingwina, akt byłby nieważny. Z powodów, które nie mają nic wspólnego z fizyką, chemią czy biologią, chrztu nie należy stosować wobec pingwinów, niezależnie od użytego sformułowania słownego.

Ten zbiór teorii może mieć implikacje dla spekulatywnych scenariuszy dotyczących pochodzenia mowy. „Robienie rzeczy słowami” zakłada wspólne zrozumienie i porozumienia dotyczące nie tylko języka, ale ogólnie zachowania społecznego. Małpy mogą wytwarzać sekwencje ustrukturyzowanych dźwięków, wpływając na siebie w ten sposób. Aby jednak użyć siły illokucji , musieliby wejść w niefizyczną i niebiologiczną sferę – sferę wspólnych kontraktów i innych niematerialnych. Ta nowa sfera poznawcza składa się z tego, co filozofowie nazywają „faktami instytucjonalnymi” — obiektywnymi faktami, których istnienie, paradoksalnie, zależy od wspólnotowej wiary lub przekonań. Niewielu prymatologów, psychologów ewolucyjnych czy antropologów uważa, że naczelne niebędące ludźmi są zdolne do niezbędnego poziomu wspólnej uwagi, trwałego zaangażowania lub współpracy w dążeniu do przyszłych celów.

Biosemiotyka

Struktura części podwójnej helisy DNA

„odszyfrowanie kodu genetycznego ujawniło, że posiadamy język znacznie starszy niż hieroglify, język tak stary jak samo życie, język, który jest najbardziej żywym językiem ze wszystkich – nawet jeśli jego litery są niewidoczne, a jego słowa są zakopane komórki naszych ciał”.

— Beadle, G.; Beadle, M. (1966). Język życia. Wprowadzenie do nauki o genetyce . Nowy Jork: Doubleday i spółka

Biosemiotyka to stosunkowo nowa dyscyplina, zainspirowana w dużej mierze odkryciem kodu genetycznego na początku lat sześćdziesiątych. Jego podstawowym założeniem jest to, że Homo sapiens nie jest osamotniony w swoim poleganiu na kodach i znakach. Język i kultura symboliczna muszą mieć biologiczne korzenie, stąd zasady semiotyczne muszą obowiązywać także w świecie zwierzęcym.

Odkrycie struktury molekularnej DNA najwyraźniej zaprzeczało idei, że życie można ostatecznie wyjaśnić za pomocą podstawowych praw fizyki. Litery alfabetu genetycznego wydawały się mieć „znaczenie”, ale znaczenie nie jest pojęciem, które ma jakiekolwiek miejsce w fizyce. Środowisko przyrodnicze początkowo rozwiązało tę trudność, odwołując się do pojęcia „informacji”, traktując informację jako niezależną od znaczenia. Ale innym rozwiązaniem zagadki było przypomnienie, że same prawa fizyki nigdy nie wystarczają do wyjaśnienia zjawisk naturalnych. Aby wyjaśnić, powiedzmy, unikalne właściwości fizyczne i chemiczne planet w naszym Układzie Słonecznym, naukowcy muszą ustalić, w jaki sposób prawa fizyki zostały ograniczone przez określone sekwencje zdarzeń po uformowaniu się Słońca.

Według Howarda Pattee ta sama zasada odnosi się do ewolucji życia na Ziemi, procesu, w którym pewne „zamrożone wypadki” lub „naturalne ograniczenia” od czasu do czasu drastycznie zmniejszają liczbę możliwych skutków ewolucyjnych. Kody, gdy okazują się stabilne w czasie ewolucji, są tego rodzaju ograniczeniami. Najbardziej fundamentalnym takim „zamrożonym przypadkiem” było pojawienie się DNA jako samoreplikującej się molekuły, ale historia życia na Ziemi charakteryzowała się ciągiem porównywalnie dramatycznych wydarzeń, z których każde można konceptualizować jako pojawienie się nowego kod. Z tej perspektywy ewolucyjne pojawienie się języka mówionego było jeszcze jednym wydarzeniem zasadniczo tego samego rodzaju.

Zasada Handicap

Pawi ogon: klasyczny przykład kosztownej sygnalizacji

W 1975 roku izraelski biolog teoretyczny Amotz Zahavi zaproponował nową teorię, która, choć kontrowersyjna, zdominowała myślenie Darwina o ewolucji sygnałów. „Zasada upośledzenia” Zahaviego mówi, że aby sygnały były skuteczne, muszą być wiarygodne; aby być wiarygodnym, inwestycja cielesna w nie musi być tak wysoka, aby oszustwo stało się nieopłacalne.

Paradoksalnie, jeśli ta logika zostanie przyjęta, sygnały w przyrodzie ewoluują nie po to, by były skuteczne, ale wręcz przeciwnie, by były dopracowane i marnujące czas i energię. Klasyczną ilustracją jest pawi ogon. Teoria Zahaviego polega na tym, że ponieważ pawie wypatrują męskich przechwałek i oszustów, nalegają na prezentację jakości tak kosztowną, że tylko prawdziwie wysportowany paw mógł sobie pozwolić na zapłacenie. Nie trzeba dodawać, że nie wszystkie sygnały w świecie zwierząt są tak wyszukane jak pawi ogon. Ale jeśli Zahavi ma rację, wszystkie wymagają pewnej fizycznej inwestycji — nakładu czasu i energii, które w jakiś sposób „utrudniają” sygnalistę.

Odgłosy zwierzęce (według Zahaviego) są wiarygodne, ponieważ są wiernym odzwierciedleniem stanu ciała sygnalisty. Aby przejść od szczerego do podstępnego zawołania, zwierzę musiałoby przyjąć inną postawę ciała. Ponieważ każde działanie cielesne ma swoją własną optymalną pozycję wyjściową, zmiana tej pozycji w celu wytworzenia fałszywego komunikatu zakłócałaby zadanie wykonania naprawdę zamierzonego działania. Zyski uzyskane przez oszustwo nie zrekompensują strat poniesionych przez przyjęcie niewłaściwej postawy — tak więc fałszywa wiadomość okazuje się nie warta swojej ceny. ^{P. 69} Może to wyjaśniać w szczególności, dlaczego sygnały głosowe małp i małp wyewoluowały tak, że są tak uderzająco nieelastyczne w porównaniu z różnymi dźwiękami mowy wytwarzanymi przez ludzki język. Pozorna nieelastyczność wokalizacji szympansów może zaskoczyć ludzkiego obserwatora, dopóki nie zdamy sobie sprawy, że bycie nieelastycznym wiąże się z koniecznością odczuwania uczciwości w sensie „trudnego do podrobienia”.

Jeśli przyjmiemy tę teorię, pojawienie się mowy staje się teoretycznie niemożliwe. Tego rodzaju komunikacja po prostu nie może ewoluować. Problem w tym, że słowa są tanie. Nic w ich właściwościach akustycznych nie może uspokoić słuchaczy, że są autentyczne, a nie podróbki. Każda strategia polegania na języku innej osoby — być może najbardziej elastycznym organie w ciele — zakłada bezprecedensowy poziom uczciwości i zaufania. Do tej pory myśliciele darwinowi mieli trudności z wyjaśnieniem wymaganych poziomów współpracy i zaufania w całej społeczności.

Wpływowym standardowym podręcznikiem jest Animal Signals, autorstwa Johna Maynarda Smitha i Davida Harpera . Autorzy ci dzielą koszty komunikacji na dwa składniki: (1) inwestycję niezbędną do zapewnienia transmisji sygnału dostrzegalnego; (2) inwestycja niezbędna do zagwarantowania, że każdy sygnał jest wiarygodny i nie jest fałszywy. Autorzy zwracają uwagę, że choć koszty w drugiej kategorii mogą być stosunkowo niskie, to nie są zerowe. Nawet w stosunkowo luźnych, opartych na współpracy kontekstach społecznych — na przykład, gdy zachodzi komunikacja między genetycznymi krewnymi — należy poczynić pewne inwestycje, aby zagwarantować niezawodność. Krótko mówiąc, pojęcie superwydajnej komunikacji — eliminującej wszystkie koszty z wyjątkiem tych niezbędnych do udanej transmisji — jest biologicznie nierealne. Jednak mowa mieści się właśnie w tej kategorii.

Przedstawienie Zasady Handicapowej opracowane przez Johnstone z 1997 roku.

Wykres przedstawia różne natężenia sygnałów w wyniku kosztów i korzyści. Jeśli dwie osoby ponoszą różne koszty, ale mają te same korzyści lub mają różne korzyści, ale te same koszty, będą sygnalizować na różnych poziomach. Wyższy sygnał oznacza bardziej niezawodną jakość. Osoba o wysokiej jakości maksymalizuje koszty w stosunku do korzyści przy wysokiej intensywności sygnału, podczas gdy osoba o niskiej jakości maksymalizuje korzyści w stosunku do kosztów przy niskiej intensywności sygnału. Wykazano, że wysokiej jakości osoba podejmuje większe ryzyko (większe koszty), co można rozumieć w kategoriach uczciwych sygnałów, które są drogie. Im jesteś silniejszy, tym łatwiej możesz ponieść koszt sygnału, co czyni cię bardziej atrakcyjnym partnerem do godów. Osoby o niskiej jakości rzadziej będą w stanie pozwolić sobie na konkretny sygnał i w konsekwencji będą mniej skłonne do przyciągnięcia samicy.

Językoznawstwo kognitywne

Językoznawstwo kognitywne uważa, że struktura językowa powstaje w sposób ciągły z użycia. Mówcy nieustannie odkrywają nowe sposoby przekazywania znaczeń poprzez produkowanie dźwięków, aw niektórych przypadkach te nowatorskie strategie ulegają skonwencjonalizacji. Pomiędzy strukturą fonologiczną a semantyczną nie ma związku przyczynowego. Zamiast tego każde nowe połączenie dźwięku i znaczenia wiąże się z pomysłowym skokiem.

W swojej książce Metaphors We Live By George Lakoff i Mark Johnson pomogli pionierom w tym podejściu, twierdząc, że metafora jest tym, co czyni ludzką myśl wyjątkową. Przekonywali, że cały język jest przesiąknięty metaforą, której użycie w rzeczywistości konstytuuje specyficznie ludzką — to znaczy specyficznie abstrakcyjną — myśl. Aby skonceptualizować rzeczy, które nie mogą być bezpośrednio postrzegane — wartości niematerialne, takie jak czas, życie, rozum, umysł, społeczeństwo lub sprawiedliwość — nie mamy innego wyboru, jak tylko wyruszyć z bardziej konkretnych i bezpośrednio dostrzegalnych zjawisk, takich jak ruch, położenie, odległość, rozmiar itp. naprzód. We wszystkich kulturach na całym świecie, według Lakoffa i Johnsona, ludzie uciekają się do tak znanych metafor, jak idee są miejscami, myślenie jest w ruchu, a umysł jest ciałem . Na przykład możemy wyrazić ideę „dotarcia do kluczowego punktu naszej argumentacji”, postępując tak, jakbyśmy dosłownie podróżowali z jednego fizycznego miejsca do drugiego.

Metafory z definicji nie są dosłownie prawdziwe. Ściśle mówiąc, są to fikcje — z pedantycznego punktu widzenia, nawet kłamstwa. Ale jeśli nie moglibyśmy uciec się do metaforycznych fikcji, wątpliwe jest, czy moglibyśmy w ogóle tworzyć konceptualne reprezentacje takich mglistych zjawisk, jak „idee”, myśli, „umysły” i tak dalej.

Związek tych idei z obecnym myśleniem o pochodzeniu mowy pozostaje niejasny. Jedną z sugestii jest to, że komunikacja małpy ma tendencję do opierania się metaforze z powodów społecznych. Ponieważ zamieszkują darwinowski (w przeciwieństwie do moralnie regulowanego) świat społeczny, zwierzęta te znajdują się pod silną presją konkurencji, aby nie akceptować fikcji patentowych jako ważnej waluty komunikacyjnej. Komunikacja wokalna małpy bywa nieelastyczna, marginalizując ultraelastyczny język, właśnie dlatego, że słuchacze traktują z podejrzliwością każdy sygnał, który może okazać się fałszywy. Takie naleganie na dostrzegalną prawdziwość jest wyraźnie niezgodne z zastosowaniem metaforycznym. Wynika z tego, że ani wyartykułowana mowa, ani charakterystycznie ludzka abstrakcyjna myśl nie mogły zacząć ewoluować, dopóki nasi przodkowie nie stali się bardziej skłonni do współpracy i zaufania do swoich intencji komunikacyjnych.

Nauki przyrodnicze a interpretacje nauk społecznych

Rzeczywistość społeczna

Kiedy ludzie rozmawiają ze sobą, według amerykańskiego filozofa Johna Searle'a , wykonują ruchy nie w rzeczywistym świecie, w którym żyją inne gatunki, ale we wspólnym wirtualnym królestwie, które jest dla nas właściwe. W przeciwieństwie do rozmieszczenia wysiłku mięśni w celu poruszenia obiektu fizycznego, rozmieszczenie siły illokucji nie wymaga żadnego wysiłku fizycznego (z wyjątkiem ruchu języka/ust w celu wytworzenia mowy) i nie daje żadnego efektu, który mógłby wykryć każde urządzenie pomiarowe. Zamiast tego nasza akcja toczy się na zupełnie innym poziomie — rzeczywistości społecznej . Ten rodzaj rzeczywistości jest w pewnym sensie halucynacyjny, będąc produktem zbiorowej intencjonalności. Składa się nie z „faktów brutalnych” — faktów, które i tak istnieją, niezależnie od czyichś przekonań — ale z „faktów instytucjonalnych”, które „istnieją” tylko wtedy, gdy w nie wierzysz. Rząd, małżeństwo, obywatelstwo i pieniądze to przykłady „faktów instytucjonalnych”. Za pomocą prostego testu można odróżnić fakty „brutalne” od „instytucjonalnych”. Załóżmy, że nikt w to nie wierzył — czy to nadal będzie prawda? Jeśli odpowiedź brzmi „tak”, to „brute”. Jeśli odpowiedź brzmi „nie”, to „instytucjonalna”.

„Wyobraź sobie grupę prymitywnych stworzeń, mniej więcej takich jak my… Teraz wyobraź sobie, że działając jako grupa, budują barierę, mur wokół miejsca, w którym żyją… Ściana jest zaprojektowana tak, aby powstrzymać intruzów i zatrzymać członków grupy w ... Załóżmy, że ściana stopniowo niszczeje. Powoli niszczeje, aż zostaje tylko linia kamieni. Przypuśćmy jednak, że mieszkańcy nadal traktują linię kamieni tak, jakby mogła funkcji muru. Przypuśćmy, że w gruncie rzeczy traktują linię kamieni tak, jakby rozumieli, że nie można jej przekroczyć… Przesunięcie to jest decydującym posunięciem w kreowaniu rzeczywistości instytucjonalnej To nic innego jak decydujący ruch w tworzeniu tego, co uważamy za charakterystyczne dla ludzi, w przeciwieństwie do zwierząt, społeczeństw”.

— John R. Searle (1995). Budowa rzeczywistości społecznej . Darmowa prasa. P. 134.

Fakty dotyczące języka w ogólności, a mowy w szczególności, są z tej perspektywy raczej „instytucjonalne” niż „brutalne”. Na przykład znaczenie semantyczne słowa jest takie, jakie wyobrażają sobie jego użytkownicy. „Robić rzeczy słowami” to działać w wirtualnym świecie, który wydaje się prawdziwy, ponieważ dzielimy go ze sobą. W tym bezcielesnym świecie prawa fizyki, chemii i biologii nie mają zastosowania. To wyjaśnia, dlaczego siła illokucyjna może być zastosowana bez wysiłku mięśniowego. Małpy i małpy zamieszkują „brutalny” świat. Aby wywrzeć wpływ, muszą krzyczeć, szczekać, grozić, uwodzić lub w inny sposób inwestować wysiłek fizyczny. Gdyby zostali zaproszeni do gry w szachy, nie mogliby się oprzeć rzucaniu w siebie pionkami. Mowa nie jest taka. Kilka ruchów języka, w odpowiednich warunkach, może wystarczyć do otwarcia parlamentu, unieważnienia małżeństwa, nadania rycerstwa lub wypowiedzenia wojny. Aby wyjaśnić, na zasadzie darwinowskiej, jak ta pozorna magia zaczęła działać, musimy zapytać, jak, kiedy i dlaczego Homo sapiens zdołał ustanowić szerszą domenę faktów instytucjonalnych.

Natura czy społeczeństwo?

„ Brutalne fakty ”, w terminologii aktu mowy filozofa Johna Searle'a , są faktami, które i tak są prawdziwe, niezależnie od ludzkich przekonań. Załóżmy, że nie wierzysz w grawitację: przeskocz przez urwisko, a nadal będziesz spadać. Nauki przyrodnicze to badanie faktów tego rodzaju. „Fakty instytucjonalne” to fikcje, którym przypisuje się faktyczny status w ludzkich instytucjach społecznych . Fakty monetarne i handlowe są tego rodzaju fikcją. Złożoność dzisiejszego globalnego systemu walutowego jest faktem tylko wtedy, gdy w nie wierzymy: zawiesić wiarę, a fakty odpowiednio się rozpłyną. Jednak chociaż fakty instytucjonalne opierają się na ludzkich wierzeniach, nie czyni to ich zwykłymi zniekształceniami lub halucynacjami. Uwierz mi, że te dwa pięciofuntowe banknoty w mojej kieszeni są warte dziesięć funtów. To nie tylko moje subiektywne przekonanie: to obiektywny, niepodważalny fakt. Ale teraz wyobraźmy sobie załamanie zaufania publicznego do systemu walutowego. Nagle rzeczywistość w mojej kieszeni rozpływa się.

Uczeni, którzy wątpią w naukową słuszność pojęcia „faktów instytucjonalnych”, to Noam Chomsky , dla którego język nie jest społeczny. W ujęciu Chomsky'ego język jest obiektem naturalnym (składnikiem indywidualnego mózgu), a zatem jego badanie jest gałęzią nauk przyrodniczych. Wyjaśniając pochodzenie języka, uczeni w tym obozie intelektualnym odwołują się do zjawisk niespołecznych — w przypadku Chomsky'ego — przypadkowej mutacji genetycznej. Chomsky twierdzi, że język może istnieć w mózgu pojedynczego zmutowanego goryla, nawet jeśli nikt inny w niego nie wierzył, nawet jeśli nikt inny nie istniał poza mutantem – i nawet jeśli dany goryl pozostał nieświadomy swojego istnienia, nigdy w rzeczywistości nie mówił . W przeciwnym obozie filozoficznym są ci, którzy zgodnie z tradycją Ferdynanda de Saussure'a twierdzą, że gdyby nikt nie wierzył w słowa lub zasady, po prostu by nie istniały. Uczeni ci, odpowiednio, uważają język za zasadniczo instytucjonalny, dochodząc do wniosku, że językoznawstwo powinno być uważane za temat w ramach nauk społecznych . Wyjaśniając ewolucyjne pojawienie się języka, uczeni w tym obozie intelektualnym mają tendencję do przywoływania głębokich zmian w stosunkach społecznych.

Krytyka. Współcześni darwiniści widzą niewielką wartość w tradycyjnym rozróżnieniu między nauką „naturalną” i „społeczną”. Darwinizm w swojej nowoczesnej formie to nauka o kooperacji i rywalizacji w naturze — temat z natury rzeczy społeczny. Na tym tle wśród lingwistów ewolucyjnych i antropologów darwinowskich rośnie świadomość, że tradycyjne bariery interdyscyplinarne mogą mieć szkodliwe konsekwencje dla badań nad pochodzeniem mowy.

Zobacz też

Uwagi

Dalsza lektura

Bickerton, D. 2009. Język Adama. Nowy Jork: Hill i Wang.
Botha, R. i C. Knight (red.) 2009. Prehistoria języka. Oksford: Oxford University Press.
Botha, R. i C. Knight (red.) 2009. Kolebka języka. Oksford: Oxford University Press.
Burling, R. 2005. Gadający Małpa. Jak ewoluował język. Oksford: Oxford University Press.
Christiansen, M. i S. Kirby (red.), 2003. Ewolucja języka. Oksford: Oxford University Press.
Corballis , MC, 2002. Od ręki do ust: Początki języka. Princeton i Oxford: Princeton University Press.
Deacon, TW, 1997. Gatunki symboliczne: koewolucja języka i mózgu. Nowy Jork: WW Norton.
de Boera. 2001. „Początki systemów samogłoskowych”, Oxford University Press.
de Grolier, E. (red.), 1983. Pochodzenie i ewolucja języka. Paryż: Harwood Academic Publishers.
Deutscher, G. 2005. Rozwijanie się języka. Ewolucja największego wynalazku ludzkości. Londyn: Losowy dom.
Dor, D., C. Knight i J. Lewis (red.), 2014. Społeczne pochodzenie języka. Oksford: Oxford University Press.
Dunbar, RIM 1996. Pielęgnacja, plotki i ewolucja języka. Londyn: Faber i Faber.
Dunbar, RIM; Rycerz, Chris; Moc, Camilla. (1999). Ewolucja kultury: spojrzenie interdyscyplinarne . Edynburg: Edinburgh University Press. Numer ISBN 978-0-7486-1076-1. OCLC 807340111 .
Fitch, WT 2010. Ewolucja języka. Cambridge: Wydawnictwo Uniwersytetu Cambridge.
Harnad, SR, HD Steklis i J. Lancaster (red.), 1976. Początki i ewolucja języka i mowy. Nowy Jork: Roczniki Nowojorskiej Akademii Nauk.
Hrdy, SB 2009. Matki i inni. Ewolucyjne początki wzajemnego zrozumienia. Londyn i Cambridge, Massachusetts: Belknap Press z Harvard University Press.
Hurford, JR 2007. Początki znaczenia. Język w świetle ewolucji. Oksford: Oxford University Press.
Hurford, James R.; Studdert-Kennedy, Michael.; Rycerz Chris (1998). Podejścia do ewolucji języka: podstawy społeczne i poznawcze . Cambridge, Wielka Brytania ; Nowy Jork: Cambridge University Press. Numer ISBN 978-0-521-63964-4. OCLC 37742390 .
Kenneally, C. 2007. Pierwsze słowo. Poszukiwanie źródeł języka. Nowy Jork: Wiking.
Lenneberg, EH 1967. Biologiczne podstawy języka. Nowy Jork: Wiley.
Leroi-Gourhan, A. 1993. Gesty i mowa. Przeł. A. Bostock Berger. Cambridge, Massachusetts: MIT Press.
Lieberman, Filip. (1991). Wyjątkowo ludzkie: ewolucja mowy, myśli i bezinteresownego zachowania . Cambridge, Massachusetts: Wydawnictwo Uniwersytetu Harvarda. Numer ISBN 978-0-674-92182-5. OCLC 21764294 .
Lieberman, Filip. (2006). W kierunku ewolucyjnej biologii języka . Cambridge, Massachusetts: Belknap Press z Harvard University Press. Numer ISBN 978-0-674-02184-6. OCLC 62766735 .
Logan, Robert K. 2007. „The Extended Mind: Pojawienie się języka, ludzkiego umysłu i kultury. Toronto: University of Toronto Press.
MacNeilage, P. 2008. Pochodzenie mowy. Oksford: Oxford University Press.
Maynard Smith, J. i D. Harper 2003. Sygnały zwierzęce. Oksford: Oxford University Press.
Oudeyer, PY. (2006) „Samoorganizacja w ewolucji mowy”, Oxford University Press.
Tallerman, M. i K. Gibson (red.), 2012. Oxford Handbook of Language Evolution. Oksford: Oxford University Press.
Tomasello, M. 2008. Początki komunikacji międzyludzkiej. Cambridge, Massachusetts: MIT Press.
Zahavi, A. i A. Zahavi 1997. Zasada upośledzenia. Brakujący element układanki Darwina. Nowy Jork i Oxford: Oxford University Press.

Languages

In other projects

Pochodzenie mowy - Origin of speech

Tło

Niezależność od modalności

Ewolucja narządów mowy

Język

Usta

Kontrola oddechowa

Krtań

Hipoteza przesadnej wielkości

Mowa neandertalska

Kanał podjęzykowy

Pochodzenie dźwięków mowy

Teoria cech dystynktywnych

Krytyka

Teoria samoorganizacji

Teoria gestów

Krytyka

Kalendarium ewolucji mowy

Scenariusze spekulacyjne

Wczesne spekulacje

Problemy niezawodności i oszustwa

„Wybór rodu”

Krytyka

„Wzajemny altruizm”

Krytyka

„Plotki i uwodzenie”

Krytyka

Od pantomimy do mowy

„Koewolucja rytuału/mowy”

Krytyka

Spekulacje XX wieku

Początki świąteczne

„Muzykojęzyk”

Egalitaryzm łowców-zbieraczy

Intersubiektywność

Kontrdominacja

Odwrócona dominacja

Scenariusze obejmujące interakcje matka-dziecko

„Odkładanie dziecka”

Hodowla spółdzielcza

Czy „mama” było pierwszym słowem?

Teoria budowy nisz

Ramy koncepcyjne

Strukturalizm

Behawioryzm

Chomskiański natywizm

Teoria aktów mowy

Biosemiotyka

Zasada Handicap

Językoznawstwo kognitywne

Nauki przyrodnicze a interpretacje nauk społecznych

Rzeczywistość społeczna

Natura czy społeczeństwo?

Zobacz też

Uwagi

Dalsza lektura

Zewnętrzne linki