Łacina podstawowa (blok Unicode) — Basic Latin (Unicode block)

Kontrolki C0 i podstawowa łacina
Zasięg U+0000..U+007F
(128 punktów kodowych)
Samolot BMP
Skrypty Łacina (52 znaki)
Wspólna (76 znaków)
Główne alfabety angielski
francuski
niemiecki
hiszpański
wietnamski
Zestawy symboli Cyfry arabskie
Interpunkcja
Przydzielony 128 punktów kodowych
33 Kontrola lub formatowanie
Nie używany 0 zarezerwowanych punktów kodowych
Standardy źródłowe ISO/IEC 8859 , ISO 646
Historia wersji Unicode
1.0.0 (1991) 128 (+128)
Uwaga :

Alfabetu łacińskiego bądź sterowania C0 Basic Łacińskiej blok Unicode jest pierwszy blok Unicode normą, a tylko bloku, który jest kodowany na jednym bajcie w UTF-8 . Blok zawiera wszystkie litery i kody kontrolne kodowania ASCII. Waha się ona od U + 0000 do U + 007F, zawiera 128 znaków i obejmuje kontrole C0 , ASCII znaki interpunkcyjne i symbole , ASCII cyfr zarówno wielkie litery i małe litery z alfabetu angielskiego oraz znak kontrolny .

Blok Basic Latin został dołączony w obecnej formie od wersji 1.0.0 standardu Unicode, bez dodawania lub zmiany repertuaru znaków. Jego nazwa bloku w Unicode 1.0 to ASCII .

Tabela postaci

Kod Wynik Opis Akronim
Sterowanie C0
U+0000 Znak zerowy NUL
U+0001 Początek nagłówka SOH
U+0002 Początek tekstu STX
U+0003 Znak końca tekstu ETX
U+0004 Znak końca transmisji EOT
U+0005 Zapytanie charakter ENQ
U+0006 Potwierdź postać POTWIERDZ
U+0007 Znak dzwonka BEL
U+0008 Backspace BS
U+0009 Zakładka pozioma HT
U + 000A Podawanie linii LF
U + 000 mld Zakładka pionowa VT
U + 000C Kanał formularzy FF
U+000D Zwrot karetki CR
U + 000E Przesuń się WIĘC
U+000F Przesunięcie w SI
U+0010 Ucieczka łącza danych DLE
U+0011 Kontrola urządzenia 1 DC1
U+0012 Kontrola urządzenia 2 DC2
U+0013 Kontrola urządzenia 3 DC3
U+0014 Kontrola urządzenia 4 DC4
U+0015 Znak negatywnego potwierdzenia NAK
U+0016 Synchroniczny bezczynność SYN
U+0017 Koniec bloku transmisji ETB
U+0018 Anuluj postać MÓC
U+0019 Koniec medium EM
U+001A Znak zastępczy POD
U+001B Ucieczka znak WYJŚCIE
U+001C Separator plików FS
U+001D Separator grupowy GS
U+001E Separator rekordów RS
U+001F Separator jednostek nas
Interpunkcja i symbole ASCII
U+0020   Przestrzeń SP
U+0021 ! Wykrzyknik EXC
U+0022 " Cudzysłów QUO
U+0023 # Znak liczbowy
U+0024 $ Znak dolara
U+0025 % Znak procentu
U+0026 & Ampersand
U+0027 ' Apostrof
U+0028 ( Nawias lewy
U+0029 ) Prawy nawias
U+002A * Gwiazdka
U+002B + Znak plusa
U + 002C , Przecinek
U+002D - Łącznik-minus
U+002E . Kropka lub kropka
U+002F / Solidus lub Slash
Cyfry ASCII
U+0030 0 Cyfra zero
U+0031 1 Cyfra pierwsza
U+0032 2 Cyfra druga
U+0033 3 Cyfra trzecia
U+0034 4 Cyfra czwarta
U+0035 5 Cyfra piąta
U+0036 6 Cyfra sześć
U+0037 7 Cyfra siódma
U+0038 8 Cyfra ósma
U+0039 9 Cyfra dziewięć
Interpunkcja i symbole ASCII
U+003A : Okrężnica
U+003B ; Średnik
U + 003C < Mniej niż znak
U+003D = Znak równości
U+003E > Większy niż znak
U+003F ? Znak zapytania
U+0040 @ Pod znakiem lub komercyjnym w
Wielkie litery alfabetu łacińskiego
U+0041 A Łacińska litera A
U+0042 b Łacińska litera B
U+0043 C Łacińska litera C
U+0044 D Łacińska wielka litera D
U+0045 mi Łacińska wielka litera E
U+0046 F Łacińska wielka litera F
U+0047 g Łacińska litera G
U+0048 h Łacińska wielka litera H
U+0049 i Łacińska wielka litera I
U+004A J Łacińska litera J
U+004B K Łacińska litera K
U + 004C L Łacińska litera L
U+004D m Łacińska litera M
U + 004E n Łacińska litera N
U+004F O Łacińska wielka litera O
U+0050 P Łacińska litera P
U+0051 Q Łacińska litera Q
U+0052 r Łacińska litera R
U+0053 S Łacińska litera S
U+0054 T Łacińska litera T
U+0055 U Łacińska litera U
U+0056 V Łacińska wielka litera V
U+0057 W Łacińska litera W
U+0058 x Łacińska litera X
U+0059 Tak Łacińska litera Y
U+005A Z Łacińska litera Z
Interpunkcja i symbole ASCII
U+005B [ Lewy wspornik kwadratowy
U + 005C \ Ukośnik wsteczny
U+005D ] Prawy wspornik kwadratowy
U + 005E ^ Okrągły akcent
U+005F _ Niska linia
U+0060 ` Poważny akcent
Małe litery alfabetu łacińskiego
U+0061 a Łacińska mała litera A
U+0062 b Łacińska mała litera B
U+0063 C Łacińska mała litera C
U+0064 D Łacińska mała litera D
U+0065 mi Łacińska mała litera E
U+0066 F Łacińska mała litera F
U+0067 g Łacińska mała litera G
U+0068 h Łacińska mała litera H
U+0069 i Łacińska mała litera I
U+006A J Łacińska mała litera J
U+006B k Łacińska mała litera K
U+006C ja Łacińska mała litera L
U+006D m Łacińska mała litera M
U+006E n Łacińska mała litera N
U+006F o Łacińska mała litera O
U+0070 P Łacińska mała litera P
U+0071 Q Łacińska mała litera Q
U+0072 r Łacińska mała litera R
U+0073 s Łacińska mała litera S
U+0074 T Łacińska mała litera T
U+0075 ty Łacińska mała litera U
U+0076 v Łacińska mała litera V
U+0077 w Łacińska mała litera W
U+0078 x Łacińska mała litera X
U+0079 tak Łacińska mała litera Y
U+007A z Łacińska mała litera Z
Interpunkcja i symbole ASCII
U+007B { Lewy nawias klamrowy
U+007C | Pionowy pasek
U+007D } Prawy nawias klamrowy
U+007E ~ Tylda
Postać kontrolna
U+007F Kasować DEL
A Litera U+005C (\) może pojawić się jako znak jena(¥) lub wygranej(₩) w czcionkach japońskich/koreańskich, myląc Unicode (zwłaszczaUTF-8) ze starszym zestawem znaków, w którym ukośnik został zastąpiony tymi znakami.

Podtytuły

Blok C0 Controls and Basic Latin zawiera sześć podtytułów.

Sterowanie C0

Kontrolki C0 , określane jako kody kontrolne C0 ASCII w wersji 1.0, są dziedziczone z ASCII i innych 7-bitowych i 8-bitowych schematów kodowania. Nazwy aliasów dla kontrolek C0 pochodzą z normy ISO/IEC 6429:1992 .

Interpunkcja i symbole ASCII

Podpozycja ta odnosi się do standardowych znaków interpunkcyjnych, prostych operatorów matematycznych oraz symboli, takich jak znak dolara, procent, ampersand, podkreślenie i kreska.

Cyfry ASCII

Podpozycja ASCII Digits zawiera standardowe europejskie znaki numeryczne 1–9 i 0.

Wielkie litery alfabetu łacińskiego

Podtytuł Wielkiego alfabetu łacińskiego zawiera standardowy 26-literowy nieakcentowany alfabet łaciński w majuskule .

Małe litery alfabetu łacińskiego

Podtytuł alfabetu łacińskiego małymi literami zawiera standardowy 26-literowy alfabet łaciński bez akcentu w minuskule .

Postać kontrolna

Podtytuł Control Character zawiera znak „Delete”.

Liczba symboli, liter i kodów kontrolnych

Poniższa tabela pokazuje liczbę liter , symboli i kodów kontrolnych w każdym z podtytułów w bloku C0 Controls i Basic Latin.

Rodzaj podpozycji Liczba symboli Zakres znaków
Sterowanie C0 32 kody kontrolne U+0000 do U+001F
Interpunkcja i symbole ASCII 33 znaki interpunkcyjne i symbole U+0020 do U+002F, U+003A do U+0040, U+005B do U+0060 i U+007B do U+007E
Cyfry ASCII 10 cyfr U+0030 do U+0039
Wielkie litery alfabetu łacińskiego W majuskule 26 nieakcentowanych liter łacińskich. U+0041 do U+005A
Małe litery alfabetu łacińskiego 26 nieakcentowanych liter łacińskich w miniaturce. U+0061 do U+007A
Postać kontrolna 1 kod sterujący zawierający znak „Usuń”. U+007F

Blok

Kontrole C0 i
tabela kodów Basic Latin Official Unicode Consortium (PDF)
  0 1 2 3 4 5 6 7 8 9 A b C D mi F
U+000x  NUL   SOH   STX   ETX   EOT   ENQ   POTWIERDZ   BEL    BS     HT     LF     VT     FF     CR     WIĘC     SI  
U+001x  DLE   DC1   DC2   DC3   DC4   NAK   SYN   ETB   MÓC    EM    POD   WYJŚCIE    FS     GS     RS     nas  
U+002x   SP   ! " # $ % & ' ( ) * + , - . /
U+003x 0 1 2 3 4 5 6 7 8 9 : ; < = > ?
U+004x @ A b C D mi F g h i J K L m n O
U+005x P Q r S T U V W x Tak Z [ \ ] ^ _
U+006x ` a b C D mi F g h i J k ja m n o
U+007x P Q r s T ty v w x tak z { | } ~  DEL 
Uwagi
1. ^ Od wersji Unicode 13.0

Warianty

Kilka znaków jest zdefiniowanych do renderowania jako znormalizowany wariant, jeśli poprzedzone są wskaźnikami wariantu.

Wariant jest zdefiniowany dla zera z krótkim skokiem ukośnym: U+0030 CYFRA ZERO, U+FE00 VS1 (0︀).

Po dwunastu znakach (#, * i cyfrach) można umieścić U+FE0E VS15 lub U+FE0F VS16, aby utworzyć warianty emoji . Są to znaki podstawowe nasadek klawiszy, na przykład #️⃣ (U+0023 ZNAK NUMERU U+FE0F VS16 U+20E3 ŁĄCZĄCY KLAWIATURY OBUDOWUJĄCE). Wersja VS15 to „prezentacja tekstowa”, podczas gdy wersja VS16 jest „w stylu emoji”.

Sekwencje wariacji emoji
U+ 0023 002A 0030 0031 0032 0033 0034 0035 0036 0037 0038 0039
baza # * 0 1 2 3 4 5 6 7 8 9
podstawa + VS15 + nasadka klawiszy #︎⃣ *︎⃣ 0︎⃣ 1︎⃣ 2︎⃣ 3︎⃣ 4︎⃣ 5︎⃣ 6︎⃣ 7︎⃣ 8︎⃣ 9︎⃣
podstawa + VS16 + nasadka klawiszy #️⃣ *️⃣ 0️⃣ 1️⃣ 2️⃣ 3️⃣ 4️⃣ 5️⃣ 6️⃣ 7️⃣ 8️⃣ 9️⃣

Historia

Poniższe dokumenty związane z Unicode rejestrują cel i proces definiowania określonych znaków w bloku Basic Latin:

Wersja Ostateczne punkty kodowe Liczyć  Identyfikator UTC  Identyfikator L2  Identyfikator WG2 Dokument
1.0.0 U+0000..007F 128 (do ustalenia)
UTC/1999-013 Karlsson, Kent (1999-05-27), tyldy i dekompozycje mikroznaków
L2/99-176R Moore, Lisa (04.11.1999), "Micro Sign Case Mappings", Protokoły ze wspólnego spotkania UTC/L2 w Seattle, 8-10 czerwca 1999
L2/04-145 Starner, David (2004-04-30), C z przykładami znaków obrysu z raportu BAE 1884 (Dorsey)
L2/04-202 Anderson, Deborah (2004-06-07), sprzężenie zwrotne z obciętym C
N3046 Suignard, Michel (2006-02-22), Poprawa formalnej definicji znaków kontrolnych
N3103 (pdf , doc ) Umamaheswaran, VS (25.08.2006), „M48.33”, Niepotwierdzone protokoły z 48 spotkania WG 2, Mountain View, CA, USA; 2006-04-24/27
L2/11-043 Freytag, Asmus; Karlsson, Kent (2011-02-02), Propozycja poprawienia błędów i niespójności w niektórych przypisaniach własności dla liter super i z indeksem dolnym
L2/11-160 PRI #181 Zmiana ogólnej kategorii dwunastu postaci , 2011-05-02
L2/11-261R2 Moore, Lisa (2011-08-16), "Consensus 128-C3", UTC #128 / L2 #225 Minutes , Zaakceptuj zalecenia Kena Whistlera w L2/11-281 dotyczące aliasów nazw znaków kontrolnych z dodatkiem skrótów BEL oraz NUL.
L2/11-438 N4182 Edberg, Peter (2011-12-22), Sekwencje wariacji emoji (wersja L2/11-429)
L2/15-107 Moore, Lisa (2015-05-12), „Konsensus 143-C5”, UTC #143 Minuty , Dodaj 12 sekwencji klawiszy w emoji-data.txt jako tymczasowe sekwencje nazwane w Unicode 8.0.
L2/15-268 Beeton, Barbara; Freytag, Asmus; Iancu, Laurențiu; Sargent, Murray (2015-10-30), Propozycja reprezentowania wariantu z odciętym zerem pustego zestawu
L2/15-301 Pournader, Roozbeh (01.11.2015), Propozycja 278 standardowych sekwencji wariacyjnych dla emoji
L2/15-254 Moore, Lisa (2016-11-16), „B.12.1.2 Propozycja przedstawienia wariantu z obniżonym zerem pustego zestawu”, UTC #145 Minut
L2/17-294 N4914 Lunde, Ken (2017-08-14), Propozycja dodania standardowej sekwencji wariacji dla U + FF10 FULLWIDTH DIGIT ZERO

Zobacz też

Bibliografia

  1. ^ "Baza danych znaków Unicode" . Standard Unicode . Pobrano 09.07.2016 .
  2. ^ „Wyliczone wersje standardu Unicode” . Standard Unicode . Pobrano 09.07.2016 .
  3. ^ Standardowa wersja Unicode 1.0, tom 1 . Addison-Wesley Publishing Company, Inc. 1990. ISBN 0-201-56788-1.
  4. ^ „3.8: Wykresy blok po bloku” (PDF) . Standard Unicode . wersja 1.0. Konsorcjum Unicode .
  5. ^ Sorting it all Out : Kiedy odwrotny ukośnik nie jest odwrotnym ukośnikiem?
  6. ^ B c d e f g "Unicode wykresy kod 6.2" (PDF) . Standard Unicode . Źródło 1 kwietnia 2013 .
  7. ^ Beeton, Barbara; Freytag, Asmus; Iancu, Laurențiu; Sargent, Murray (30.10.2015). „L2/15-268: Propozycja przedstawienia wariantu zerowego z przecięciem pustego zestawu” (PDF) .
  8. ^ B "UTS 51 EMOJI zmienności sekwencje" . Konsorcjum Unicode.
  9. ^ Edberg, Piotr (22.12.2011). „L2/11-438: Sekwencje wariacji emoji (wersja L2/11-429)” (PDF) .
  10. ^ Pournader, Roozbeh (01.11.2015). „L2/15-301: Propozycja 278 standardowych sekwencji odmian emoji” (PDF) .
  11. ^ "UTR #51: Unicode Emoji" . Konsorcjum Unicode. 2020-02-11.
  12. ^ „UCD: Dane Emoji dla UTR #51” . Konsorcjum Unicode. 2021-08-26.