Kod języka - Language code

Kod języka jest kod , który przypisuje litery lub cyfry jako identyfikatory lub klasyfikatorów dla języków . Kody te mogą być wykorzystywane do organizowania zbiorów bibliotecznych lub prezentacji danych , do wybierania poprawnych lokalizacji i tłumaczeń w informatyce oraz jako skrócone oznaczenie dla dłuższych form nazw językowych.

Trudności klasyfikacji

Schematy kodu językowego próbują klasyfikować złożony świat ludzkich języków, dialektów i wariantów . Większość schematów zawiera pewne kompromisy między byciem ogólnym i wystarczającym do obsługi określonych dialektów.

Na przykład większość ludzi w Ameryce Środkowej i Południowej mówi po hiszpańsku . Hiszpański używany w Meksyku będzie się nieco różnił od hiszpańskiego używanego w Peru . Różne regiony Meksyku będą miały nieco inne dialekty i akcenty hiszpańskiego. Schemat kodu języka może grupować je wszystkie jako „hiszpański” w celu wybrania układu klawiatury, w większości jako „hiszpański” do ogólnego użytku, lub oddzielić każdy dialekt, aby umożliwić stosowanie idiomów specyficznych dla regionu.

Wspólne schematy

Niektóre popularne schematy kodów językowych obejmują:

Schemat Uwagi Przykład dla języka angielskiego Przykład dla języka hiszpańskiego
Kody glottologiczne Stworzony dla języków mniejszości jako naukowa alternatywa dla przemysłowej normy ISO 639-3.
Celowo nie przypominają skrótów.
  • stan1293 – standardowy angielski
  • macr1271 – makro-angielski (nowoczesny angielski, w tym kreolski)
  • midd1317 – średnioangielski
  • merc1242 – Mercian (średnio – współczesny angielski)
  • olde1238 – staroangielski
  • angl1265 – Anglian (staro – współczesny angielski, w tym Szkoci)
  • stan1288 – standardowy hiszpański
  • olds1249starohiszpański
  • cast1243 – kastylijski (stary – współczesny hiszpański, w tym ekstremaduran i kreole)
Znacznik języka IETF Najlepsza praktyka IETF, określona przez BCP 47, dotycząca znaczników języka, które można łatwo przeanalizować przez komputer. System tagów można rozszerzyć o oznaczenia regionalne, dialektowe i prywatne. Odwołuje się do ISO 639, ISO 3166 i ISO 15924.
  • en – angielski, jako najkrótszy kod ISO 639.
  • en-US — angielski używany w Stanach Zjednoczonych (USA to kod kraju ISO 3166‑1 dla Stanów Zjednoczonych)

Źródło: notatka IETF

  • es – hiszpański, jako najkrótszy kod ISO 639.
  • es-419 – hiszpański odpowiedni dla regionu Ameryki Łacińskiej i Karaibów, przy użyciu kodu regionu UN M.49
ISO 639-1 Dwuliterowy system kodów wprowadzony oficjalnym w 2002 roku, zawierający 136 kodów. Wiele systemów wykorzystuje dwuliterowe kody ISO 639-1 uzupełnione trzyliterowymi kodami ISO 639-2, gdy nie ma zastosowania dwuliterowy kod.

Zobacz: Lista kodów ISO 639-1

  • en
  • es – hiszpański
ISO 639-2 Trzyliterowy system 464 kodów.

Zobacz: Lista kodów ISO 639-2

  • pol – trzyliterowy kod
  • enm – średnioangielski, ok. 1100–1500
  • ang – staroangielski, ok. 450–1100
  • cpe – inne kreole i pidgins oparte na języku angielskim
  • spa – hiszpański
ISO 639-3 Rozszerzenie ISO 639-2 na wszystkie znane, żywe lub martwe, mówione lub pisane języki w 7589 hasłach.

Zobacz: Lista kodów ISO 639-3

  • pol – trzyliterowy kod
  • enm – średnioangielski, ok. 1100–1500
  • aig – Antigua i Barbuda kreolski angielski
  • ang – staroangielski, ok. 450–1100
  • svc – kreolski wincentyński angielski
  • spa – hiszpański
  • spq – hiszpański, Loreto-Ukajali
  • ssp – hiszpański język migowy
System kodów Linguasphere Register Dwucyfrowy + od jednej do sześciu liter system kodów Linguasphere Register opublikowany w 2000 r., zawierający ponad 32 000 kodów w 10 sektorach odniesienia, obejmujących języki i społeczności językowe świata.

Poruszaj się również po hierarchii systemu kodów Linguasphere Register opublikowanego online przez hortensj-garden.org

W ramach hierarchii systemu kodów Linguasphere Register:

  • 5= filosektor indoeuropejski
  • 52= germański filozon
  • 52-Zestaw germański
  • 52-AB angielski + łańcuch anglo-kreolski
  • 52-ABA angielska sieć
  • 52-ABA-c Globalna angielska
    jednostka zewnętrzna
    52-ABA-ca do
    52-ABA-cwe
    (186 odmian)

Porównaj: 52-ABA-a Scots + Northumbrian
zewnętrzna jednostka i 52-ABA-b „Anglo-English” zewnętrzna jednostka
(= tradycyjne odmiany Południowej Wielkiej Brytanii + Old Anglo-Irish)

W ramach hierarchii systemu kodów Linguasphere Register:

  • 5= filosektor indoeuropejski
  • 51= romański filozon
  • 51-Zestaw romantyczny
  • 51-AA Romansowy łańcuch
  • 51-AAA Zachodni Romans netto
  • 51-AAA-b
    Jednostka zewnętrzna Español/Castellano
    51-AAA-ba do
    51-AAA-bkk
    (58 odmian)

Porównaj: jednostka zewnętrzna 51-AAA-a Português + Galego i jednostka zewnętrzna 51-AAA-c Astur + Leonés itp.

Kody SIL (10-14 edycja) Kody stworzone do użytku w Ethnologue , publikacji SIL International zawierającej statystyki dotyczące języków. Publikacja wykorzystuje teraz kody ISO 639-3. ENG SPN
Kody językowe Verbix Skonstruowane kody zaczynające się od starych kodów SIL i dodające więcej informacji. ENG SPN

Zobacz też

Bibliografia

Zewnętrzne linki