Ortografia fonemiczna - Phonemic orthography

Fonemiczna ortografia jest ortografia (system do pisania język ), w którym grafemy (pisemne symbole) odpowiadają fonemów (znaczący wypowiadane dźwięki) języka. Języki naturalne rzadko mają idealnie ortografie fonemiczne; w ortografiach opartych na alfabetycznych systemach pisma można się spodziewać wysokiego stopnia korespondencji grafemowo-fonemowej , ale różnią się one stopniem kompletności tej korespondencji. Na przykład ortografia angielska jest alfabetyczna, ale w dużym stopniu niefonemiczna; kiedyś był głównie fonemiczny na etapie średnioangielskim, kiedy powstała współczesna pisownia, ale mówiony angielski zmieniał się gwałtownie, podczas gdy ortografia była znacznie bardziej stabilna, co spowodowało współczesną sytuację niefonemiczną. Jednak ze względu na ich stosunkowo niedawną modernizację w porównaniu z angielskim, rumuński , włoski , turecki , hiszpański , fiński , czeski , łotewski i polski systemy ortograficzne są znacznie bliższe spójnej reprezentacji fonemicznej.

Mówiąc mniej formalnie, język o bardzo fonemicznej ortografii można określić jako posiadający regularną pisownię . Inną terminologią jest terminologia głęboka i płytka ortografia , w której głębokość ortografii jest stopniem, w jakim odbiega ona od prawdziwie fonemicznej. Koncepcję tę można również zastosować do niealfabetycznych systemów pisania, takich jak sylabariusze .

Idealna ortografia fonemiczna

W idealnej ortografii fonemicznej istniałaby pełna korespondencja jeden do jednego ( bijection ) między grafemami (literami) a fonemami języka, a każdy fonem byłby niezmiennie reprezentowany przez odpowiadający mu grafem. Tak więc pisownia słowa jednoznacznie i przejrzyście wskazywałaby jego wymowę, i odwrotnie, mówiący znający wymowę słowa byłby w stanie wywnioskować jego pisownię bez żadnych wątpliwości. Taka idealna sytuacja jest rzadka, ale istnieje w kilku językach.

Spornym przykładem idealnej ortografii fonemicznej jest język serbsko-chorwacki . W jego alfabecie ( łacińskim i serbskim cyrylicy ) występuje 30 grafemów, z których każdy jednoznacznie odpowiada jednemu z fonemów. Ta pozornie doskonała, ale prosta ortografia fonemiczna została osiągnięta w XIX wieku – alfabet cyrylicy po raz pierwszy w 1814 roku przez serbskiego językoznawcę Vuka Karadžicia , a alfabet łaciński w 1830 roku przez chorwackiego językoznawcę Ljudevita Gaja . Jednak zarówno alfabet łaciński Gaja, jak i cyrylica serbska nie rozróżniają samogłosek krótkich i długich oraz nietonicznych (zapisana jest krótka), wznoszących i opadających tonów, które ma serbsko-chorwacki. W serbsko-chorwackim tony i długości samogłosek były opcjonalnie zapisywane jako (po łacinie) ⟨e⟩, ⟨ē⟩, ⟨è⟩, ⟨é⟩, ⟨ȅ⟩ i ⟨ȇ⟩, zwłaszcza w słownikach.

Kolejna taka idealna ortografia fonemiczna pochodzi z Esperanto i wykorzystuje wymawianą wówczas zasadę twórcy języka LL Zamenhofa „jedna litera, jeden dźwięk”.

Istnieją dwa różne rodzaje odchyleń od tego ideału fonemicznego. W pierwszym przypadku dokładna korespondencja jeden do jednego może zostać utracona (na przykład jakiś fonem może być reprezentowany przez dwuznak zamiast pojedynczej litery), ale zostaje zachowana „prawidłowość”: nadal istnieje algorytm (ale bardziej złożony) do przewidywania pisowni na podstawie wymowy i odwrotnie. W drugim przypadku wprowadza się prawdziwą nieprawidłowość, ponieważ pewne słowa zaczynają być pisane i wymawiane według innych reguł niż inne, a przewidywanie pisowni na podstawie wymowy i odwrotnie nie jest już możliwe. W dalszej części omówiono typowe przypadki obu typów odchyleń od ideału.

Odchylenia od ortografii fonemicznej

Poniżej wymieniono niektóre sposoby, w jakie ortografie mogą odbiegać od ideału korespondencji jeden-do-jednego grafem-fonem. Pierwsza lista zawiera odchylenia, które jedynie komplikują relację między pisownią a wymową, nie wpływając na jej przewidywalność (patrz akapit powyżej).

Przypadek 1: Regularny

Wymowa i pisownia nadal odpowiadają w przewidywalny sposób

  • Fonem może być reprezentowany przez ciąg liter, zwany multigrafem , a nie przez pojedynczą literę (jak w przypadku dwuznaku ch w języku francuskim i trygrafu sch w języku niemieckim). Zachowuje to przewidywalność tylko wtedy, gdy multigrafu nie można podzielić na mniejsze jednostki. Niektóre języki używają znaków diakrytycznych, aby odróżnić dwuznak od sekwencji pojedynczych liter, a inne wymagają znajomości języka, aby je odróżnić; porównaj pasterza i wstrętnego w języku angielskim.

Przykłady:

sch kontra s-ch w języku retoromańskim

ng kontra n + g w języku walijskim

ch versus çh w Manx Gaelic : jest to nieco inny przypadek, w którym ten sam dwuznak jest używany dla dwóch różnych pojedynczych fonemów.

ai kontra po francusku

Często jest to spowodowane użyciem alfabetu, który był pierwotnie używany dla innego języka ( w tych przykładach alfabetu łacińskiego ) i dlatego nie ma pojedynczych liter dostępnych dla wszystkich fonemów używanych w bieżącym języku (chociaż niektóre ortografie używają urządzeń takich jak jako znaki diakrytyczne, aby zwiększyć liczbę dostępnych liter).

  • Czasami odwrotnie, pojedyncza litera może reprezentować ciąg więcej niż jednego fonemu (ponieważ x może reprezentować ciąg /ks/ w języku angielskim i innych językach).
  • Czasami zasady korespondencji są bardziej złożone i zależą od sąsiednich liter, często w wyniku historycznych zmian brzmieniowych (jak w przypadku zasad wymowy ca i ci w języku włoskim i niemego e w języku angielskim).

Przypadek 2: Nieregularne

Wymowa i pisownia nie zawsze odpowiadają w przewidywalny sposób

  • Czasami różne litery odpowiadają temu samemu fonemowi (na przykład u i ó w języku polskim wymawia się jako fonem /u/). Często dzieje się tak ze względów historycznych (polskie litery pierwotnie oznaczały różne fonemy, które później połączyły się fonologicznie). Wpływa to na przewidywalność pisowni z wymowy, ale niekoniecznie odwrotnie. Inny przykład można znaleźć w języku nowogreckim , którego fonem /i/ można zapisać na sześć różnych sposobów: ι, η, υ, ει, οι i υι.
  • I odwrotnie, litera lub grupa liter może odpowiadać różnym fonemom w różnych kontekstach. Na przykład th w języku angielskim może być wymawiane jako /ð/ (jak w tym ) lub /θ/ (jak w thin ), a także /th/ (jak w goatherd ).
  • Pisownia może inaczej reprezentować wymowę historyczną; ortografia niekoniecznie nadąża za zmianami dźwięku w języku mówionym. Na przykład zarówno k , jak i dwuznak gh angielskiego rycerza były kiedyś wymawiane (ten ostatni jest nadal wymawiany w niektórych odmianach szkockich ), ale po utracie ich dźwięków nie reprezentują już struktury fonemicznej słowa ani jego wymowy.
  • Pisownia może reprezentować wymowę innego dialektu niż rozważany.
  • Pisownia wyrazów zapożyczonych często jest zgodna z ortografią języka źródłowego lub pod jej wpływem (jak w przypadku angielskich słów ballet i fajita , odpowiednio z francuskiego i hiszpańskiego ). Jednak w przypadku niektórych zapożyczeń prawidłowość zachowuje albo:
  • Pisownia może odzwierciedlać etymologii ludowej (jak w angielskich słów hiccough , wyspa , więc orkiszu z powodu wyimaginowanego związku ze słowa kaszlu i wyspy ) lub odległej etymologii (jak w angielskim słowie długu w którym milczą b dodano pod wpływ łaciny).
  • Pisownia może odzwierciedlać raczej strukturę morfofemiczną niż czysto fonemiczną (patrz następna sekcja), chociaż często jest to również odzwierciedlenie wymowy historycznej.

Większość ortografii nie odzwierciedla zmian w wymowie znanych jako sandhi, w których na wymowę wpływają sąsiednie dźwięki w sąsiednich słowach (pisemny sanskryt i inne języki indyjskie odzwierciedlają jednak takie zmiany). Język może również używać różnych zestawów symboli lub różnych reguł dla różnych zestawów elementów słownictwa, takich jak japońskie sylabariusze hiragana i katakana (oraz różne traktowanie w angielskiej ortografii słów pochodzących z łaciny i greki).

Cechy morfofoniczne

Ortografie alfabetyczne często mają cechy bardziej morfofemiczne niż czysto fonemiczne. Oznacza to, że pisownia odzwierciedla w pewnym stopniu podstawową strukturę morfologiczną słów, a nie tylko ich wymowę. Stąd różne formy morfemu (minimalnej znaczącej jednostki językowej) są często pisane identycznie lub podobnie, pomimo różnic w ich wymowie. Często dzieje się tak z powodów historycznych; pisownia morfofonemiczna odzwierciedla poprzednią wymowę sprzed historycznych zmian dźwiękowych, które spowodowały zróżnicowanie wymowy danego morfemu. Taka pisownia może pomóc w rozpoznawaniu słów podczas czytania.

Poniżej opisano niektóre przykłady cech morfofonemicznych w ortografii.

  • Angielski morfem liczby mnogiej zapisywany jest -s niezależnie od tego, czy jest wymawiany jako /s/ czy /z/ , np. cat s i dog s , a nie cat s i dog z . Dzieje się tak, ponieważ dźwięki [s] i [z] są formami tego samego podstawowego morfofonu , automatycznie wymawiane różnie w zależności od środowiska. (Jednak gdy ten morfem przyjmuje postać /ɪz/ , dodanie samogłoski znajduje odzwierciedlenie w pisowni: church es , mass es .)
  • Podobnie angielski morfem czasu przeszłego jest zapisywany -ed niezależnie od tego, czy jest wymawiany jako /d/ , /t/ czy /ɪd/ .
  • Wiele angielskich słów zachowuje pisownię, która odzwierciedla ich etymologię i morfologię, a nie ich dzisiejszą wymowę. Na przykład znak i podpis zawierają pisownię „znak”, co oznacza to samo, ale w obu słowach wymawia się inaczej. Innymi przykładami są Sci ence / saɪ / vs con Sci ence / ʃ / , wstępnie judice / prɛ / w porównaniu z wcześniej quel / Prl / , na nia / neɪ / vs na zmem / NAE / i spe cial / spɛ / vs . spe Cies / SPI / .
  • Asymilacja fonologiczna często nie znajduje odzwierciedlenia w pisowni nawet w ortografiach fonemicznych, takich jak hiszpański, w których obtener „uzyskać” i optimista „optimista” są pisane za pomocą b i p , ale są powszechnie neutralizowane w odniesieniu do dźwięczności i wymawiane na różne sposoby, takie jak jako oba [β] w stylu neutralnym lub oba [p] w empatycznej wymowie. Z drugiej strony, serbsko-chorwacki (serbski, chorwacki, bośniacki i czarnogórski) pisownia odzwierciedla asymilacji tak się pisze Ср Â ија / Sr b Ija „Serbia”, ale ср ß ски / sr p narciarski „serbski”.
  • Voice-obstruent końcowy , który występuje w wielu językach (takich jak niemieckim, polskim i rosyjskim) zwykle nie jest odzwierciedlone w pisowni. Na przykład w języku niemieckim Bad „kąpiel” jest pisane z końcowym ⟨d⟩, mimo że jest wymawiane / t / , co odpowiada innym morfologicznie pokrewnym formom, takim jak czasownik baden (kąpać), w którym d jest wymawiane / d / . (Porównaj Rat , raten ( „rada”, „porada”), w którym t wymawia się /t/ w obu pozycjach). Ortografia turecka jest jednak bardziej fonemiczna: na przykład imperatyw eder „robi” jest pisany et , tak jak jest wymawiane (i tak samo jak słowo „mięso”), a nie *ed , jak gdyby używano niemieckiej pisowni.

Koreański hangul na przestrzeni wieków zmienił się z ortografii silnie fonemicznej w ortografię w dużej mierze morfofonemiczną.Japońskie kana są prawie całkowicie fonemiczne, ale mają kilka aspektów morfofonemicznych, zwłaszcza w użyciu ぢdi i づdu (zamiast じji i ずzu , ich wymowa w standardowym dialekcie tokijskim ), gdy postać jest wyrażona w lub . Wynika to ze zmiany brzmienia rendaku połączonej z połączeniem yotsugany z formalnie odmiennych morae. Rosyjski ortografia jest głównie morphophonemic, ponieważ nie odzwierciedla redukcji samogłoski, spółgłoski asymilacji i końcowe obstruent voice. Ponadto niektóre kombinacje spółgłosek mają ciche spółgłoski.

Wadliwe ortografie

Wadliwy ortografia to taki, który nie jest w stanie reprezentować wszystkie fonemy lub fonemiczna wyróżnienia w języku. Przykładem takiego niedoboru angielskiej ortografii jest brak rozróżnienia między dźwięcznych i bezdźwięcznych „th” fonemów ( / ð / i / θ / , odpowiednio), występujące w słowach, jak to / ð ɪ s / (głos) i cienka / θ ɪ n / (bezdźwięczna), odpowiednio, w mowie ⟨th⟩.

Porównanie języków

Języki o wysokiej korespondencji grafem z fonem i fonem z grafem (z wyłączeniem wyjątków ze względu na słowa zapożyczone i asymilację) obejmują:

Wiele ortografii fonemicznych jest nieco wadliwych : malajska (w tym malezyjska i indonezyjska ), włoska , maltańska , walijska i kazachska nie rozróżniają w pełni swoich samogłosek, litewski , łotewski i serbsko-chorwacki nie rozróżnia tonu i długości samogłosek (również dodatkowych). samogłoski dla litewskiego i łotewskiego), Somali nie rozróżnia fonacji samogłosek , a grafemy b i v reprezentują ten sam fonem we wszystkich odmianach języka hiszpańskiego, podczas gdy w hiszpańskim obu Ameryk /s/ mogą być reprezentowane przez grafemy s , c lub z . Współczesne języki indo-aryjskie, takie jak hindi , pendżabski , gudżarati , maithili i kilka innych, posiadają funkcję usuwania szwa , w której niejawna domyślna samogłoska jest tłumiona bez wyraźnego oznaczenia jako takiej. Inne, takie jak Marathi , nie mają wysokiej zależności między grafem a fonemem dla długości samogłosek.

Francuski , z jego niemymi literami i intensywnym użyciem samogłosek nosowych i elizji , może wydawać się pozbawiony dużej zgodności między pisownią a wymową, ale jego zasady wymowy, choć złożone, są spójne i przewidywalne z dość dużą dokładnością. Rzeczywista korespondencja między literami a fonemem jest jednak często niska, a sekwencja dźwięków może mieć wiele sposobów zapisu.

Orthographies takie jak te z niemieckim , węgierskim (głównie fonemiczna z wyjątkiem ly , j reprezentujący ten sam dźwięk, ale spółgłoski i długość samogłoski nie zawsze są dokładne i różne pisownie odzwierciedlać etymologię, a nie wymówienie), portugalski i nowoczesny grecki (pisemne z Alfabet grecki ), jak również koreański hangul , są czasami uważane za średnio głębokie (np. zawierają wiele cech morfofonemicznych, jak opisano powyżej).

Podobnie jak w przypadku francuskiego, znacznie łatwiej jest wywnioskować wymowę niemieckiego słowa z jego pisowni niż odwrotnie. Na przykład dla mówiących, którzy łączą /eː/ i /ɛː/, fonem /eː/ można zapisać e , ee , eh , ä lub äh .

Ortografia angielska jest wysoce niefonemiczna. Nieregularność pisowni angielskiej wynika częściowo z tego, że po ustaleniu ortografii nastąpiła wielka zmiana samogłosek ; częściowo dlatego, że angielski nabył dużą liczbę zapożyczeń w różnym czasie, zachowując ich oryginalną pisownię na różnych poziomach; a częściowo dlatego, że uregulowanie pisowni (odejście od sytuacji, w której wiele różnych pisowni było dopuszczalnych dla tego samego słowa) nastąpiło arbitralnie w okresie bez centralnego planu. Jednak nawet angielski ma ogólne, aczkolwiek złożone, reguły, które przewidują wymowę z ortografii, a kilka z tych reguł sprawdza się w większości przypadków; reguły przewidywania pisowni na podstawie wymowy mają wyższy wskaźnik niepowodzeń.

Większość języków sztucznych, takich jak esperanto i lożban, ma głównie ortografie fonemiczne.

W syllabary systemy japoński ( hiragana i katakana ) są przykładami niemal idealnie płytkiej ortografii - wyjątki obejmują stosowanieぢiづ( omówione powyżej ) oraz wykorzystanieは,をiへreprezentować dźwiękiわ,おiえ, jako relikty historycznego użycia kana . Nie ma również wskazania akcentu wysokościowego, co skutkuje homografią wyrazów takich jak 箸 i 橋 (はし w hiraganie), które są rozróżniane w mowie.

Wyrównanie ortografii

Z czasem wymowa się zmienia, a pisownia staje się nieaktualna, jak to miało miejsce w przypadku angielskiego i francuskiego . Aby zachować ortografię fonemiczną, taki system wymagałby okresowej aktualizacji, jak to czynili różni regulatorzy języka i proponowali inni reformatorzy ortografii .

Czasami wymowa słowa zmienia się, aby dopasować się do jego pisowni; nazywa się to wymową pisowni . Jest to najbardziej powszechne w przypadku zapożyczeń, ale czasami występuje również w przypadku ustalonych słów rodzimych.

W niektórych angielskich imionach osobistych i nazwach miejscowości związek między pisownią nazwy a jej wymową jest tak odległy, że nie można łatwo zidentyfikować skojarzeń między fonemami a grafemami. Co więcej, w wielu innych słowach wymowa ewoluowała później od ustalonej pisowni, tak że trzeba powiedzieć, że fonemy reprezentują grafemy, a nie odwrotnie. W technicznym żargonie głównym środkiem komunikacji jest język pisany, a nie język mówiony, więc fonemy reprezentują grafemy i nie ma znaczenia, jak słowo jest wymawiane. Co więcej, na dźwięki, które osoby czytające odbierają jako słyszane w słowie, istotny wpływ ma faktyczna pisownia tego słowa.

Czasami w niektórych krajach język pisany przechodzi reformę pisowni, aby dostosować pismo do współczesnego języka mówionego. Mogą to być proste zmiany pisowni i formy słów, a także przełączenie całego systemu pisma, jak wtedy, gdy Turcja przeszła z alfabetu arabskiego na alfabet turecki pochodzenia łacińskiego.

Fonetyczna transkrypcja

Metody transkrypcji fonetycznej, takie jak Międzynarodowy Alfabet Fonetyczny (IPA), mają na celu opisanie wymowy w formie standardowej. Są często używane do rozwiązywania niejednoznaczności w pisowni języka pisanego. Mogą być również używane do pisania w językach bez wcześniejszej formy pisemnej. Systemy takie jak IPA mogą być używane do reprezentacji fonemicznej lub do pokazywania bardziej szczegółowych informacji fonetycznych (patrz Transkrypcja wąska i szeroka ).

Ortografie fonemiczne różnią się od transkrypcji fonetycznej; podczas gdy w ortografii fonemicznej alofony będą zwykle reprezentowane przez ten sam grafem, pismo czysto fonetyczne wymagałoby rozróżnienia fonetycznie odrębnych alofonów. Weźmy przykład z amerykańskiego angielskiego: dźwięk /t/ w słowach „stół” i „kot” byłby w ortografii fonemicznej napisany tym samym znakiem; jednak pismo ściśle fonetyczne rozróżniałoby między przydechowym „t” w „stół”, klapką w „masle”, bez przydechu „t” w „stop” i glottalizowanym „t” w „kot” (nie wszystkie te alofony istnieją we wszystkich angielskich dialektach ). Innymi słowy, dźwięk, który większość osób mówiących po angielsku uważa za /t/, jest w rzeczywistości grupą dźwięków, wymawianych nieco inaczej w zależności od tego, gdzie występują w słowie. Doskonała ortografia fonemiczna ma jedną literę na grupę dźwięków (fonem), z różnymi literami tylko tam, gdzie dźwięki odróżniają słowa (więc „łóżko” jest pisane inaczej niż „zakład”).

Wąska transkrypcja fonetyczna reprezentuje telefony , dźwięki, które ludzie są w stanie wytworzyć, z których wiele będzie często zgrupowanych razem jako pojedynczy fonem w dowolnym języku naturalnym, chociaż grupy różnią się w zależności od języka. Angielski na przykład nie rozróżnia spółgłosek przydechowych i nieprzydechowych, ale inne języki, takie jak koreański , bengalski i hindi tak. Z drugiej strony koreański nie rozróżnia spółgłosek dźwięcznych i bezdźwięcznych, jak wiele innych języków.

Dźwięki mowy wszystkich języków świata można zapisać raczej małym uniwersalnym alfabetem fonetycznym. Standardem jest międzynarodowy alfabet fonetyczny .

Zobacz też

Bibliografia