Alfabet urdu - Urdu alphabet

Alfabet urdu
ا حُرُوفِ ‌تَہَجِّی urdū
hurūf-e-tahajji
Przykład urdu.svg
Przykład pisania alfabetem urdu : Urdu
Typ skryptu
Abjad
Języki Urdu , Balti ,, Punjabi , Shina , rzadko używane w Burushaski , inne
Powiązane skrypty
Systemy nadrzędne
Unicode
U+0600 do U+06FF

U+0750 do U+077F
U+FB50 do U+FDFF

U+FE70 do U+FEFF
 Ten artykuł zawiera transkrypcje fonetyczne w międzynarodowym alfabecie fonetycznym (IPA) . Aby zapoznać się ze wstępnym przewodnikiem po symbolach IPA, zobacz Help:IPA . Dla rozróżnienia między [ ] , / / i ⟨  ⟩ zobacz IPA § Nawiasy i ograniczniki transkrypcji .

Urdu alfabetu ( urdu : اردو حروف تہجی , romanizowanaurdu harūf-e-tahajjī ), jest od prawej do lewej alfabet używany do Urdu . Jest to modyfikacja alfabetu perskiego , który sam jest pochodną alfabetu arabskiego . Alfabet urdu ma do 39 lub 40 odrębnych liter bez wyraźnych wielkości liter i jest zwykle pisany kaligraficznym pismem Nastaʿlīq , podczas gdy arabski jest częściej pisany w stylu Naskh .

Zazwyczaj zwykła transliteracja urdu do alfabetu łacińskiego (zwanego rzymskim urdu ) pomija wiele elementów fonemicznych , które nie mają odpowiednika w języku angielskim lub innych językach powszechnie pisanych w alfabecie łacińskim .

Historia

Standardowy skrypt urdu jest zmodyfikowaną wersją pisma perso-arabskiego i ma swoje początki w XIII-wiecznym Iranie . Jest to ściśle związane z rozwojem stylu Nastaʻliq pisma perso-arabskiego.

Pomimo wynalezienia maszyny do pisania Urdu w 1911 roku, gazety Urdu nadal publikowały wydruki odręcznych skryptów kaligrafów znanych jako katibs lub khush-navees aż do późnych lat osiemdziesiątych. Pakistańska krajowa gazeta codzienna Jang był pierwszy Urdu gazeta używać Nasta'līq skład skomputeryzowany. Trwają starania, aby opracować bardziej wyrafinowaną i przyjazną dla użytkownika obsługę Urdu na komputerach iw Internecie . Obecnie prawie wszystkie gazety, magazyny, czasopisma i czasopisma w języku urdu są tworzone na komputerach z oprogramowaniem w języku urdu.

Poza subkontynentem indyjskim pismo urdu jest również używane przez dużą diasporę Pakistanu , w tym w Wielkiej Brytanii , Zjednoczonych Emiratach Arabskich , Stanach Zjednoczonych , Kanadzie , Arabii Saudyjskiej i innych miejscach.

Nataliq

Przykład pokazujący zasady proporcji Nastaliqa (perskiego).

Urdu jest napisane w stylu Nastaliq ( perski : نستعلیق ‎ Nastaʿlīq ). Nastaliq kaligraficzne styl pisania rozpoczął jako perskiego mieszaniny Naskh i Ta'liq skryptów. Po podboju Mogołów , Nastaʻliq stał się preferowanym stylem pisania urdu. Jest to dominujący styl w Pakistanie i używa go wielu pisarzy urdu na całym świecie. Nastaʿlīq jest bardziej krzywy i płynny niż jego odpowiednik Naskh .

W alfabecie arabskim i wielu innych wywodzących się z niego literach uważa się, że każda z liter ma dwie lub trzy formy ogólne, w zależności od ich pozycji w słowie (chociaż kaligrafia arabska może dodać wiele złożoności). Ale styl Nastaliq , w którym pisane jest urdu, używa więcej niż trzech ogólnych form dla wielu listów, nawet w prostych, nie dekoracyjnych dokumentach.

Alfabet

Pismo urdu to pismo abjad wywodzące się ze współczesnego pisma perskiego , które samo w sobie jest pochodną pisma arabskiego . Jako abjad, pismo urdu pokazuje tylko spółgłoski i długie samogłoski; krótkie samogłoski można wywnioskować tylko ze stosunku spółgłosek do siebie. Podczas gdy ten typ pisma jest wygodny w językach semickich, takich jak arabski i hebrajski , których spółgłoskowe korzenie są kluczem do zdania, urdu jest językiem indoeuropejskim , który wymaga większej precyzji w wymowie samogłosek, co wymaga większego zapamiętywania. Liczba liter w alfabecie urdu jest nieco niejednoznaczna i dyskusyjna.

Nazwy liter i fonemy

List Nazwa IPA Latynizacja Dźwięk: opis lub dźwięk w języku angielskim. Unicode Zamówienie
Urdu rzymskie urdu ALA-LC
Łowca
ا ال alif /ɑː/, /ʔ/, /∅/ ā , - ā , - a jak w b a th ( angielski brytyjski , wymowa odebrana ) U+0627 1 1 1
ب بے być /b/ b b b jak w Ball. U+0628 2 2 2
پ پے pe /P/ P P p jak w Gołąb. U+067E 3 3 3
ت تے /T/ T T Dental T (używane w języku hiszpańskim i holenderskim/flamandzkim) U+062A 4 4 4
ٹ ٹے ē /ʈ/ T T T jak w ka rt a (szwedzki) U+0679 5 5 5
ث ثے s̱ē /s/ s s c jak w kinie. U+062B 6 6 6
ج م Jim /d͡ʒ/ J J J w J UG. U+062C 7 7 7
چ چے ce /t͡ʃ/ C ch ch w Ch imney. U+0686 8 8 8
ح بڑی حے baṛī ḥē /ɦ/ h h h jak w Happy. U+062D 9 9 9
ہٹی حے hutti ē
خ خے k͟hē /x/ k͟h kh Brak pełnego odpowiednika w języku angielskim. Podobny do gardłowego kh w Khundak. U+062E 10 10 10
د ال dali /D/ D D Dental D (używane w języku hiszpańskim i holenderskim/flamandzkim) U+062F 11 11 11
ڈ ال Salu /ɖ/ D D D jak w gå rd ag (szwedzki) U+0688 12 12 12
ذ ال Salu /z/ Z z Z jak u zebry. U+0630 13 13 13
ر رے odnośnie /r/ r r r jak w Razor. U+0631 14 14 14
ڑ ڑے odnośnie /ɽ/
r r Brak pełnego odpowiednika w języku angielskim. Podobny do twardego DH w Raigadh. U+0691 15 15 15
ز زے /z/ z z z jak w Zebrze. U+0632 16 16 16
ژ ژے Zhe /ʒ/
zh zh si jak w wersji. U+0698 17 17 17
س سین grzech /s/ s s s jak na morzu. U+0633 18 18 18
ش شین piszczel /ʃ/ CII CII sh jak w połysku. U+0634 19 19 19
ص ا wad /s/ s s s jak w przysiędze. U+0635 20 20 20
ض ا wad /z/ Z z z jak w gazecie. U+0636 21 21 21
ط طوے palec u nogi /T/ T T Brak pełnego odpowiednika w języku angielskim. Podobny do ta jak w Talii. U+0637 22 22 22
ظ ظوے z̤oʼē /z/ z z Trudne z w zoo. U+0638 23 23 23
ع عین ain /ɑː/, /oː/, /eː/,
/ʔ/, /ʕ/, /∅/
' '
Brak pełnego odpowiednika w języku angielskim. Podobny do ostrego gardłowego a w jabłku. U+0639 24 24 24
غ غین g͟hain /ɣ/ guha gh Brak pełnego odpowiednika w języku angielskim. Podobny do gardłowego gh w Ghalib. U+063A 25 25 25
ف فے fe /F/ F F f jak w kwiatku. U+0641 26 26 26
ق ا kaf /Q/ Q Q Nie używany w języku angielskim. W języku arabskim jest to pierwsza litera Kataru i ostatnia litera Iraku . Czasami mówi się, że przypomina wołanie wrony. U+0642 27 27 27
ک ا kaf /k/ k k k jak w Kite. U+06A9 28 28 28
گ ا gafi /ɡ/ g g g jak w trawie. U+06AF 29 29 29
ل لام chłostać /l/ ja ja l jak w cytrynie. U+0644 30 30 30
śmiać م mim /m/ m m m jak u Mike'a. U+0645 31 31 31
ن نون siostra zakonna /n/, /ɲ/,
/ɳ/, /ŋ/
n n n jak w południe. U+0646 32 32 32
ں
نون غنہ Nūn G͟hunna / /
n n Samogłoska nosowa. Nie używany w języku angielskim, ale używany w języku francuskim. U+06BA
U+0658
32a 33
و ا nie / Ʋ / / u ː /, / ʊ /,
/ O ː /, / ɔː /
v ,
ū , u , o , au
w ,
ū , u , o , au
było w portfelu. U+0648 33 33 34
ہ ل gōl he /ɦ/, /ɑː/, /eː/ H , à , e H , à , e h jak na gorąco. U+06C1
34 34 35
چھوٹی ہے Choṭī he 34a
ھ می do-cashmi he /ʰ/ lub /ʱ/
h h h jak w głowie U+06BE 35 34b 36
ی چھوٹی یے Choṭī Ye /j/, /iː/, /ɑː/ y , ī , á y , ī , á y jak w kolorze żółtym lub ee jak w dotyku. U + 06CC 36 35 38
ے بڑی یے baṛī yē /ɛː/, /eː/
ai , e ai , e a jak w kotku lub ay jak w dzień. U+06D2 37 35b 39
ئ م hamza /ʔ/ lub /∅/
, –, yi , –, yi Ya (np. jak) brzmi jako pierwszy. Ai (niechlujny dźwięk A) na sekundę. U+0626 35a 37
ء U+0621 0
Przypisy:

Dodatkowe znaki i odmiany

Arabski Ta marbūṭah

Tāʼ marbūṭah jest również czasami uważana za 40. literę alfabetu urdu, chociaż jest rzadko używana, z wyjątkiem niektórych słów zapożyczonych z arabskiego. Tāʼ marbūṭah jest uważana za formę tā, arabskiej wersji urdu te, ale nie jest wymawiana jako taka, a po zastąpieniu literą urdu w naturalizowanych słowach zapożyczonych jest zwykle zastępowana przez Gol he.

Tabela

Tabela dodatkowych znaków i odmian
Grupa List Nazwa (patrz: Słownik słów kluczowych ) Unicode
Nataliq
Naskh ze
znakami diakrytycznymi
Roman Urdu lub angielski
Alif آ آ الف م الِف م
alif madda
U+0622
alef z maddą powyżej
Hamza ء ء م م
hamza U+0621
hamza
___ ___ hamza na linii
ٔ ــٔـ ___ ___ hamza znaki diakrytyczne
U + 0654
Hamza powyżej
ئ ئ م م
hamza U + 0626
tak z hamzą powyżej
___ ___ YE Hamza / Alif Hamza
ۓ ۓ ___ ___ baṛī yē hamza U + 06D3
yeh barree z hamzą powyżej
ؤ ؤ اوِ ممُوز اوِ ممُوز
wav-e mahmūz
U + 0624
waw z hamzą powyżej
ۂ  ۂ ۂ ۂ ___ ___ U+06C2
heh gol z hamzą powyżej
lub U+06C1 + U+0654
arabski ۃ  ۃ ۃ ۃ Arabski : تاء مربوطة
Arabski : تاء
مربوطة
taʼ marbūṭah
„związany ta”
U +
06C3 gol Marbuta!
É  É ة ة U + 0629 do
marbuty
ت ت Arabski : تاء مفتوحة
Arabski : تاء
مفتوحة
Ta maftūḥah
„otwarte ta”
U + 062A
Teh
Przypisy:

Hamza w Nastaliq

Hamza mogą być trudne do rozpoznania w Urdu pisma i czcionki zaprojektowane, aby go powielać, ściśle przypominające dwie kropki nad jak opisywany w Ę TE i ق Qaf, natomiast w języku arabskim i czcionek geometryczne jest bardziej wyraźna i przypomina zachodnią formę cyfra 2 (dwa).

Digrafy

قتر

W digrafów z turbodoładowaniem spółgłoski są następujące.
Nie. Dwuznak Transkrypcja IPA Przykład
1 بھ bha [b] ا
2 پھ ph [P] ل
3 تھ NS [T] م
4 ٹھ NS [ʈʰ] ا
5 جھ jh [d͡ʒʱ] ا
6 چھ ch [t͡ʃʰ] چھتری
7 دھ dh [D] دھوبی
8 ڈھ h [ɖʱ] ل
9 رھ rha [r] ا
10 ڑھ h [ɽʱ] اا
11 کھ kh [kʰ] ا
12 گھ gh [ɡʱ] ا
13 ل lh [lʱ] دولھا (alternatywa od دُلہا
14 مھ mh [m] تمھیں (alternatywa od تمہیں )
15 نھ nh [n] ننھا (choć prawdopodobnie tylko zbitka spółgłosek)
16 وھ NS [ʋʱ] وھاب (choć prawdopodobnie tylko zbitka spółgłosek)
17 یھ tak [J]

Różnice w stosunku do alfabetu perskiego

Urdu ma więcej liter dodanych do bazy perskiej, aby reprezentować dźwięki nieobecne w języku perskim, który ma już dodatkowe litery dodane do samej bazy arabskiej, aby reprezentować dźwięki nieobecne w języku arabskim. Dodawane litery to: ٹ dla /ʈ/ , ڈ dla /ɖ/ , ڑ dla /ɽ/ , ں dla /◌̃/ i ے dla /ɛ:/ lub /e:/ . Odrębną zrób chashmi- he list, ھ istnieje oznaczający / ʰ / lub / ʱ / . Ten list jest używany głównie jako część wielu digrafów, wyszczególnionych poniżej.

Litery retroflex

Hindustani urdu retroflex litera T.svg

Stary Hindustani wykorzystywane cztery kropki ٿ ڐ ڙ ciągu trzech arabskimi literami ت د produktu PLN do reprezentowania retroflex spółgłoski. W piśmie ręcznym te kropki były często pisane jako mała pionowa linia przymocowana do małego trójkąta. Następnie, ten kształt stał się identyczny z małej litery Ø t̤o'ē . Powszechnie i błędnie zakłada się, że sam ṭāʾ był używany do wskazania spółgłosek retrofleksyjnych, ponieważ jest to wyraźna spółgłoska pęcherzykowa, którą arabscy ​​skrybowie myśleli zbliżoną do retrofleksów Hindustani. We współczesnym urdu ط , to'e jest zawsze wymawiane jako dentystyczne , a nie retrofleksyjne .

Samogłoski

Język urdu ma 10 samogłosek i 10 samogłosek nosowych. Każda samogłoska ma cztery formy w zależności od jej położenia: początkową, środkową, końcową i izolowaną. Podobnie jak w jego macierzystym alfabecie arabskim , samogłoski urdu są reprezentowane za pomocą kombinacji dwuznaków i znaków diakrytycznych. Alif , Waw , Ye , He i ich warianty są używane do reprezentowania samogłosek.

Wykres samogłosek

Urdu nie ma samodzielnych liter samogłosek. Krótkie samogłoski ( a , i , u ) są reprezentowane przez opcjonalne znaki diakrytyczne ( zabar , zer , pesh ) na poprzedzającej spółgłosce lub zastępczej spółgłosce ( alif , ain lub hamza ) , jeśli sylaba zaczyna się od samogłoski , a długie samogłoski przez spółgłoski Alif , Ain , wy i wa'o jak MATRES lectionis z ujednoznaczniania znaków diakrytycznych, z których niektóre są opcjonalne ( Zabar , zer , Pesh ), podczas gdy inne nie są ( madd , Hamzah ). Urdu nie ma krótkich samogłosek na końcu słów. To jest tabela samogłosek urdu:

Latynizacja Wymowa Finał Środkowy Wstępny
a /ə/ Nie dotyczy ـَ ا
a /a/ ا، ا آ
i /ɪ/ Nie dotyczy ـِ ا
i /i/ ى ی ا
mi /mi/ ے ی ا
ai /ɛː/ ے ی ا
ty /ʊ/ Nie dotyczy ـُ ا
¾ /uː/ و ا
o /oː/ و ا
Au /ɔː/ و ا

Alif

Alif to pierwsza litera alfabetu urdu i jest używana wyłącznie jako samogłoska. Na początku słowa alif może być użyty do przedstawienia dowolnej z krótkich samogłosek: اب ab , اسم ism , اردو Urdū . Długie ā na początku słów alif-mad jest używane: آپ ap , ale w środku i na końcu jest zwykłe alf : بھاگنا bhāgnā .

Waso

Wāʾo służy do renderowania samogłosek „ū”, „o”, „u” i „au” (odpowiednio [uː], [oː], [ʊ] i [ɔː]), a także służy do renderowania labiodental przybliżony , [ʋ]. Tylko wtedy, gdy poprzedzone zgodne khe ( خ ) może wā'o uczynić „U” ([ʊ]) dźwięk (na przykład w خودk͟hud ” - siebie ) lub nie widoczne przy wszystkich (takich jak خواب " k͟haab " - sen ).

Człek

Ye jest podzielony na dwa warianty: choṭī wy ( „małe wy”) i baṛī wy ( „duże wy”).

Choṭī ye ( ی ) jest napisane we wszystkich formach dokładnie tak, jak w perskim. Jest używany dla długiej samogłoski „ī” i spółgłoski „y”.

Baṛī ye ( ے ) służy do renderowania samogłosek „e” i „ai” ( / / i / ɛː / odpowiednio). Baṛī ye można odróżnić na piśmie od choṭī ye tylko wtedy, gdy pojawia się na końcu słowa / ligatury. Ponadto Baṛī ye nigdy nie jest używany do rozpoczęcia słowa / ligatura, w przeciwieństwie do choṭī ye .

Nazwa listu Forma końcowa Forma środkowa Forma początkowa Izolowana forma
چھوٹی يے
Choṭī ye
ی ی ی ی
بڑی يے
Baṛi ye
ے ے

2 on jest

On jest podzielony na dwa warianty: gol on ( „okrągły on”) i zrób casmi on ( „two-Eyed on”).

Gol he ( ہ ) jest pisany okrągłym i zygzakiem i może nadać dźwięk "h" ( /ɦ/ ) w dowolnym miejscu słowa. Dodatkowo na końcu słowa można go użyć do oddania długich samogłosek „a” lub „e” ( /ɑː/ lub /eː/ ), co również nieznacznie zmienia jego formę (warto zauważyć, że na współczesnych systemy cyfrowe pisanie, to ostateczna forma uzyskuje się poprzez pisanie dwa on kolejno).

Do-cašmi he ( ھ ) pisze się jak w arabskim stylu Naskh (jako pętla), w celu tworzenia spółgłosek przydechowych i pisania arabskich słów.

Nazwa listu Forma końcowa Forma środkowa Forma początkowa Izolowana forma
ل ہے
Gol he
ہ ہ ہ ہ
دو چشمی ہے
Do-casmi he
ھ ھ ھ ھ

Ajna

Ayn w swojej początkowej i końcowej pozycji milczy w wymowie i jest zastępowany dźwiękiem poprzedzającej lub następującej samogłoski.

Zakonnica Ghunnah

Nasalizacja samogłosek jest reprezentowana przez nun ghunna napisaną po ich nienasalizowanych wersjach, na przykład: ہَے po nasalizacji stanie się ہَیں . W środkowej formie nun ghunna jest pisane tak samo jak nun i różni się znakiem diakrytycznym zwanym maghnoona lub ulta jazm, który jest symbolem V w indeksie górnym nad ن٘ .

Przykłady:

Formularz Urdu Transkrypcja
Ortografia ں n
Formularz końcowy میں Główny
Forma środkowa ل kaṉwal

Znaki diakrytyczne

Urdu używa tego samego podzbioru znaków diakrytycznych używanych w języku arabskim w oparciu o konwencje perskie. Urdu używa również perskich nazw znaków diakrytycznych zamiast nazw arabskich. Powszechnie stosowane są diacritics Zabar (arabska fatḥah ) zer (arabski kasrah ) Pesh (arabski dammah ), które służą do wyjaśnienia wymowy samogłosek, jak pokazano powyżej. Jazam ( , arabski Sukun ) służy do wskazania spółgłoskę klaster i tashdid ( , arabski shaddah ) służy do wskazania podwojenie , choć nigdy nie jest używany dla czasowników, które wymagają podwójne spółgłoski być pisane oddzielnie. Inne znaki diakrytyczne to khari zabar (arabski sztylet alif ), do zabar (arabski fatatan ), które można znaleźć w niektórych popularnych arabskich słowach zapożyczonych. Inne arabskie znaki diakrytyczne są również czasami używane, choć bardzo rzadko, w wyrazach zapożyczonych z języka arabskiego . Zer-e-izafat i hamzah-e-izafat są opisane w następnej sekcji.

Oprócz zwykłych znaków diakrytycznych, Urdu ma również specjalne znaki diakrytyczne, które często znajdują się tylko w słownikach w celu wyjaśnienia nieprawidłowej wymowy. Te znaki diakrytyczne obejmują kasrah-e-majhool , fathah-e-majhool , dammah -e-majhool , maghnoona , ulta jazam , alif-e-wavi i kilka innych bardzo rzadkich znaków diakrytycznych. Wśród nich tylko maghnoona jest powszechnie używany w słownikach i ma reprezentację Unicode na U + 0658. Inne znaki diakrytyczne rzadko pisane są w formie drukowanej, głównie w niektórych zaawansowanych słownikach.

Iszafat

Iẓāfat jest konstrukcją składniową dwóch rzeczowników, gdzie pierwszy składnik jest rzeczownikiem określonym, a drugi określnikiem . Ta konstrukcja została zapożyczona z perskiego. Krótka samogłoska „i” jest używana do połączenia tych dwóch słów, a podczas wymawiania nowo utworzonego słowa krótka samogłoska jest połączona z pierwszym słowem. Jeśli pierwsze słowo kończy się na spółgłoskę lub 'ain ( ع ), może być zapisana jako zer (   )  na końcu pierwszego słowa, ale zwykle nie jest napisane w ogóle. Jeśli pierwsze słowo kończy się na choṭī he ( ہ ) lub ye ( ی lub ے ), to hamzā ( ء ) jest używane nad ostatnią literą ( ۂ lub ئ lub ۓ ). Jeśli pierwsze słowo kończy się długą samogłoską ( ا lub و ), to na końcu pierwszego słowa dodawana jest inna odmiana baṛī ye ( ے ) z hamzā na górze ( ئے , uzyskaną przez dodanie ے do ئ ).

Formularze Przykład Transliteracja Oznaczający
ــِ ا sher- e Panjab lew Pendżabu
ۂ ملکۂ ا Malika- wy dunyah królowa świata
ئ لئ امل Wali -ye Kamil doskonały święty
ۓ مۓ عشق mai- ye ishq wino miłości
ئے روئے زمین ru- ye zamin powierzchnia Ziemi
ائے لند sada – wy bulandh wysoki głos

Komputery i alfabet urdu

We wczesnych dniach komputerów Urdu nie było poprawnie reprezentowane na żadnej stronie kodowej . Jedną z najwcześniejszych stron kodowych reprezentujących język urdu był IBM Code Page 868, który pochodzi z 1990 roku. Inne wczesne strony kodowe, które reprezentowały alfabety Urdu, to kodowanie Windows-1256 i MacArabic, które pochodzą z połowy lat 90. XX wieku. W Unicode Urdu jest reprezentowane wewnątrz bloku arabskiego. Inną stroną kodową dla urdu, która jest używana w Indiach, jest Perso-Arabic Script Code for Information Interchange . W Pakistanie 8-bitowa strona kodowa opracowana przez National Language Authority nazywa się Urdu Zabta Takhti ( اردو ضابطہ تختی ) (UZT), która reprezentuje urdu w jego najbardziej kompletnej formie, w tym niektóre z jego wyspecjalizowanych znaków diakrytycznych, chociaż UZT nie jest przeznaczony do współistnieją z alfabetem łacińskim.

Kodowanie Urdu w Unicode

Mylące glify w alfabecie urdu i arabskim
Znaki
w języku urdu
Znaki
w języku arabskim
ہ (U+06C1)
ھ (U+06BE)
ه (U + 0647)
ی (U + 06CC) ى (U+0649)
ي (U+064A)
ک (U + 06A9) ك (U + 0643)

Like other writing systems derived from the Arabic script, Urdu uses the 0600–06FF Unicode range. Certain glyphs in this range appear visually similar (or identical when presented using particular fonts) even though the underlying encoding is different. This presents problems for information storage and retrieval. For example, the University of Chicago's electronic copy of John Shakespear's "A Dictionary, Hindustani, and English" includes the word 'بهارت' (bhārat "India"). Searching for the string "بھارت" returns no results, whereas querying with the (identical-looking in many fonts) string "بهارت" returns the correct entry. This is because the medial form of the Urdu letter do chashmi he (U+06BE)—used to form aspirate digraphs in Urdu—is visually identical in its medial form to the Arabic letter hāʾ (U+0647; phonetic value /h/). In Urdu, the /h/ phoneme is represented by the character U+06C1, called gol he (round he), or chhoti he (small he).

W 2003 roku Center for Research in Urdu Language Processing (CRULP) — organizacja badawcza powiązana z pakistańskim Narodowym Uniwersytetem Komputerów i Nowych Nauk — opracowała propozycję mapowania z 1-bajtowego kodowania UZT znaków Urdu do standardu Unicode. Ta propozycja sugeruje preferowany glif Unicode dla każdego znaku w alfabecie urdu.

Oprogramowanie

Dzienne Jang była pierwsza gazeta Urdu być przygotowana cyfrowo w Nasta'liq przez komputer. Trwają starania, aby opracować bardziej wyrafinowaną i przyjazną dla użytkownika obsługę Urdu na komputerach iw Internecie. Obecnie prawie wszystkie gazety, magazyny, czasopisma i czasopisma w języku urdu są tworzone na komputerach za pomocą różnych programów Urdu, z których najbardziej rozpowszechnionym jest pakiet InPage Desktop Publishing. Firma Microsoft uwzględniła obsługę języka urdu we wszystkich nowych wersjach systemu Windows, a zarówno system Windows Vista, jak i pakiet Microsoft Office 2007 są dostępne w języku urdu dzięki obsłudze pakietu Language Interface Pack . Większość dystrybucji Linux Desktop pozwala również na łatwą instalację obsługi Urdu i tłumaczeń. Firma Apple zaimplementowała klawiaturę w języku urdu na urządzeniach mobilnych w aktualizacji iOS 8 we wrześniu 2014 roku.

Standardy i systemy romanizacji

Istnieje kilka standardów latynizacji pisania urdu za pomocą alfabetu łacińskiego, chociaż nie są one zbyt popularne, ponieważ większość z nich nie jest w stanie poprawnie przedstawić języka urdu. Zamiast standardowych schematów latynizacji ludzie korzystający z Internetu, telefonów komórkowych i mediów często używają niestandardowej formy latynizacji, która próbuje naśladować angielską ortografię . Problem z tego rodzaju latynizacją polega na tym, że mogą ją czytać tylko native speakerzy, a nawet dla nich z dużym trudem. Wśród standardowych schematów latynizacji najdokładniejsza jest latynizacja ALA-LC , która jest również wspierana przez National Language Authority . Inne schematy latynizacji są często odrzucane, ponieważ albo nie są w stanie poprawnie reprezentować dźwięków w urdu, albo często nie uwzględniają ortografii urdu i przedkładają wymowę nad ortografię.

Krajowy Urząd Język z Pakistanu opracowała szereg systemów z konkretnych zapisów oznaczać non-angielskich dźwięków, ale mogą one być prawidłowo odczytane tylko przez kogoś już zaznajomiony z listów kredytowych.

Roman Urdu ma również znaczenie wśród chrześcijan w Pakistanie i północnych Indiach . Urdu był dominującym językiem ojczystym wśród chrześcijan w Karaczi i Lahore we współczesnym Pakistanie oraz Madhya Pradesh , Uttar Pradesh Radżastan w Indiach na początku XIX i XX wieku i jest nadal używany przez chrześcijan w tych miejscach. Chrześcijanie z Pakistanu i Indii często używali pisma rzymskiego do pisania urdu. Tak więc rzymskie urdu było powszechnym sposobem pisania wśród chrześcijan pakistańskich i indyjskich na tych terenach aż do lat sześćdziesiątych. Indyjskie Towarzystwo Biblijne publikuje Biblie w języku urdu, które sprzedawano pod koniec lat sześćdziesiątych (chociaż nadal są publikowane). Śpiewniki kościelne są również powszechne w rzymskim urdu. Jednak użycie rzymskiego urdu zanika wraz z szerszym użyciem hindi i angielskiego w tych stanach.

Załączniki

Słowniczek słów kluczowych z nazw liter

Tłumaczenia i inne zastosowania słów kluczowych z nazw liter w języku urdu
Imię (imiona) słowo urdu Przykłady innych zastosowań
Izolowana
forma
Urdu
nazwa
rzymskie urdu Urdu IPA Roman Urdu
nazwa
Angielskie tłumaczenie Urdu Roman Urdu lub IPA Tłumaczenie
ح بڑی حے baṛī ħē بڑی bəɽi baṛī /
bari
duży / starszy بڑی آنت Baṛi ant jelito grube
ے بڑی يے baṛī yē آنت Mrówka jelito
ی چھوٹی یے čhōṭī ye چھوٹی tʃʰoːʈi choti mały/młodszy/młodszy
ہ چھوٹی ہے čhōṭī he چھوٹی آنت jelito cienkie
ل gōl he ل gol Gole okrągłe / kuliste / niejasne / głupie / otyłe ل gol gappay Pani puri
ھ می dō-czaszmi he م do-cashmih dwuoki
می do-cashmi

dorabina

lornetka
دوربین dorabina teleskop
دو robić 2/dwa اانیت czy ayvanit bikameralizm
م /tʃəʃm/ chashm oko / nadzieja / oczekiwanie م kaszma oko
ں نون غنہ nūn-e ğunnah غنہ nnɑ unnah  /g͟hunnah nosowy dźwięk lub brzdęk
آ الِف م alif madda مده madda arabski :
ؤ اوِ ممُوز wav-e mahmūz مہموز mahmuːz mahmūz wadliwy/niewłaściwy
ء ا آ ب پ ت ٹ ث ب ج چ خ ح د ڈ ذ ر ڑ ز ژ ش ش ص ض ط ظ ع غ ف ق ک ل ل م ن ں و ہ ھ ی حروف تہجی
harūf tahajī ( alfabet ) تہجی tahaji sekwencja
حروف /hʊruːf/ harūf litery (liczba mnoga)
(często określane jako „alfabety” w nieformalnym języku pakistańskim)
حرف /hərf/ harf „litera alfabetu” / pismo odręczne / oświadczenie / wina / piętno

Zobacz też

Bibliografia

Źródła

Zewnętrzne linki