Łacina podstawowa (blok Unicode) — Basic Latin (Unicode block)
Kontrolki C0 i podstawowa łacina | |
---|---|
Zasięg | U+0000..U+007F (128 punktów kodowych) |
Samolot | BMP |
Skrypty |
Łacina (52 znaki) Wspólna (76 znaków) |
Główne alfabety |
angielski francuski niemiecki hiszpański wietnamski |
Zestawy symboli |
Cyfry arabskie Interpunkcja |
Przydzielony | 128 punktów kodowych 33 Kontrola lub formatowanie |
Nie używany | 0 zarezerwowanych punktów kodowych |
Standardy źródłowe | ISO/IEC 8859 , ISO 646 |
Historia wersji Unicode | |
1.0.0 (1991) | 128 (+128) |
Uwaga : |
Alfabetu łacińskiego bądź sterowania C0 Basic Łacińskiej blok Unicode jest pierwszy blok Unicode normą, a tylko bloku, który jest kodowany na jednym bajcie w UTF-8 . Blok zawiera wszystkie litery i kody kontrolne kodowania ASCII. Waha się ona od U + 0000 do U + 007F, zawiera 128 znaków i obejmuje kontrole C0 , ASCII znaki interpunkcyjne i symbole , ASCII cyfr zarówno wielkie litery i małe litery z alfabetu angielskiego oraz znak kontrolny .
Blok Basic Latin został dołączony w obecnej formie od wersji 1.0.0 standardu Unicode, bez dodawania lub zmiany repertuaru znaków. Jego nazwa bloku w Unicode 1.0 to ASCII .
Tabela postaci
- A Litera U+005C (\) może pojawić się jako znak jena(¥) lub wygranej(₩) w czcionkach japońskich/koreańskich, myląc Unicode (zwłaszczaUTF-8) ze starszym zestawem znaków, w którym ukośnik został zastąpiony tymi znakami.
Podtytuły
Blok C0 Controls and Basic Latin zawiera sześć podtytułów.
Sterowanie C0
Kontrolki C0 , określane jako kody kontrolne C0 ASCII w wersji 1.0, są dziedziczone z ASCII i innych 7-bitowych i 8-bitowych schematów kodowania. Nazwy aliasów dla kontrolek C0 pochodzą z normy ISO/IEC 6429:1992 .
Interpunkcja i symbole ASCII
Podpozycja ta odnosi się do standardowych znaków interpunkcyjnych, prostych operatorów matematycznych oraz symboli, takich jak znak dolara, procent, ampersand, podkreślenie i kreska.
Cyfry ASCII
Podpozycja ASCII Digits zawiera standardowe europejskie znaki numeryczne 1–9 i 0.
Wielkie litery alfabetu łacińskiego
Podtytuł Wielkiego alfabetu łacińskiego zawiera standardowy 26-literowy nieakcentowany alfabet łaciński w majuskule .
Małe litery alfabetu łacińskiego
Podtytuł alfabetu łacińskiego małymi literami zawiera standardowy 26-literowy alfabet łaciński bez akcentu w minuskule .
Postać kontrolna
Podtytuł Control Character zawiera znak „Delete”.
Liczba symboli, liter i kodów kontrolnych
Poniższa tabela pokazuje liczbę liter , symboli i kodów kontrolnych w każdym z podtytułów w bloku C0 Controls i Basic Latin.
Rodzaj podpozycji | Liczba symboli | Zakres znaków |
---|---|---|
Sterowanie C0 | 32 kody kontrolne | U+0000 do U+001F |
Interpunkcja i symbole ASCII | 33 znaki interpunkcyjne i symbole | U+0020 do U+002F, U+003A do U+0040, U+005B do U+0060 i U+007B do U+007E |
Cyfry ASCII | 10 cyfr | U+0030 do U+0039 |
Wielkie litery alfabetu łacińskiego | W majuskule 26 nieakcentowanych liter łacińskich. | U+0041 do U+005A |
Małe litery alfabetu łacińskiego | 26 nieakcentowanych liter łacińskich w miniaturce. | U+0061 do U+007A |
Postać kontrolna | 1 kod sterujący zawierający znak „Usuń”. | U+007F |
Blok
Kontrole C0 i tabela kodów Basic Latin Official Unicode Consortium (PDF) |
||||||||||||||||
0 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | A | b | C | D | mi | F | |
U+000x | NUL | SOH | STX | ETX | EOT | ENQ | POTWIERDZ | BEL | BS | HT | LF | VT | FF | CR | WIĘC | SI |
U+001x | DLE | DC1 | DC2 | DC3 | DC4 | NAK | SYN | ETB | MÓC | EM | POD | WYJŚCIE | FS | GS | RS | nas |
U+002x | SP | ! | " | # | $ | % | & | ' | ( | ) | * | + | , | - | . | / |
U+003x | 0 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | : | ; | < | = | > | ? |
U+004x | @ | A | b | C | D | mi | F | g | h | i | J | K | L | m | n | O |
U+005x | P | Q | r | S | T | U | V | W | x | Tak | Z | [ | \ | ] | ^ | _ |
U+006x | ` | a | b | C | D | mi | F | g | h | i | J | k | ja | m | n | o |
U+007x | P | Q | r | s | T | ty | v | w | x | tak | z | { | | | } | ~ | DEL |
Uwagi
|
Warianty
Kilka znaków jest zdefiniowanych do renderowania jako znormalizowany wariant, jeśli poprzedzone są wskaźnikami wariantu.
Wariant jest zdefiniowany dla zera z krótkim skokiem ukośnym: U+0030 CYFRA ZERO, U+FE00 VS1 (0︀).
Po dwunastu znakach (#, * i cyfrach) można umieścić U+FE0E VS15 lub U+FE0F VS16, aby utworzyć warianty emoji . Są to znaki podstawowe nasadek klawiszy, na przykład #️⃣ (U+0023 ZNAK NUMERU U+FE0F VS16 U+20E3 ŁĄCZĄCY KLAWIATURY OBUDOWUJĄCE). Wersja VS15 to „prezentacja tekstowa”, podczas gdy wersja VS16 jest „w stylu emoji”.
U+ | 0023 | 002A | 0030 | 0031 | 0032 | 0033 | 0034 | 0035 | 0036 | 0037 | 0038 | 0039 |
baza | # | * | 0 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 |
podstawa + VS15 + nasadka klawiszy | #︎⃣ | *︎⃣ | 0︎⃣ | 1︎⃣ | 2︎⃣ | 3︎⃣ | 4︎⃣ | 5︎⃣ | 6︎⃣ | 7︎⃣ | 8︎⃣ | 9︎⃣ |
podstawa + VS16 + nasadka klawiszy | #️⃣ | *️⃣ | 0️⃣ | 1️⃣ | 2️⃣ | 3️⃣ | 4️⃣ | 5️⃣ | 6️⃣ | 7️⃣ | 8️⃣ | 9️⃣ |
Historia
Poniższe dokumenty związane z Unicode rejestrują cel i proces definiowania określonych znaków w bloku Basic Latin:
Wersja | Ostateczne punkty kodowe | Liczyć | Identyfikator UTC | Identyfikator L2 | Identyfikator WG2 | Dokument |
---|---|---|---|---|---|---|
1.0.0 | U+0000..007F | 128 | (do ustalenia) | |||
UTC/1999-013 | Karlsson, Kent (1999-05-27), tyldy i dekompozycje mikroznaków | |||||
L2/99-176R | Moore, Lisa (04.11.1999), "Micro Sign Case Mappings", Protokoły ze wspólnego spotkania UTC/L2 w Seattle, 8-10 czerwca 1999 | |||||
L2/04-145 | Starner, David (2004-04-30), C z przykładami znaków obrysu z raportu BAE 1884 (Dorsey) | |||||
L2/04-202 | Anderson, Deborah (2004-06-07), sprzężenie zwrotne z obciętym C | |||||
N3046 | Suignard, Michel (2006-02-22), Poprawa formalnej definicji znaków kontrolnych | |||||
N3103 (pdf , doc ) | Umamaheswaran, VS (25.08.2006), „M48.33”, Niepotwierdzone protokoły z 48 spotkania WG 2, Mountain View, CA, USA; 2006-04-24/27 | |||||
L2/11-043 | Freytag, Asmus; Karlsson, Kent (2011-02-02), Propozycja poprawienia błędów i niespójności w niektórych przypisaniach własności dla liter super i z indeksem dolnym | |||||
L2/11-160 | PRI #181 Zmiana ogólnej kategorii dwunastu postaci , 2011-05-02 | |||||
L2/11-261R2 |
Moore, Lisa (2011-08-16), "Consensus 128-C3", UTC #128 / L2 #225 Minutes , Zaakceptuj zalecenia Kena Whistlera w L2/11-281 dotyczące aliasów nazw znaków kontrolnych z dodatkiem skrótów BEL oraz NUL. |
|||||
L2/11-438 | N4182 | Edberg, Peter (2011-12-22), Sekwencje wariacji emoji (wersja L2/11-429) | ||||
L2/15-107 |
Moore, Lisa (2015-05-12), „Konsensus 143-C5”, UTC #143 Minuty , Dodaj 12 sekwencji klawiszy w emoji-data.txt jako tymczasowe sekwencje nazwane w Unicode 8.0. |
|||||
L2/15-268 | Beeton, Barbara; Freytag, Asmus; Iancu, Laurențiu; Sargent, Murray (2015-10-30), Propozycja reprezentowania wariantu z odciętym zerem pustego zestawu | |||||
L2/15-301 | Pournader, Roozbeh (01.11.2015), Propozycja 278 standardowych sekwencji wariacyjnych dla emoji | |||||
L2/15-254 | Moore, Lisa (2016-11-16), „B.12.1.2 Propozycja przedstawienia wariantu z obniżonym zerem pustego zestawu”, UTC #145 Minut | |||||
L2/17-294 | N4914 | Lunde, Ken (2017-08-14), Propozycja dodania standardowej sekwencji wariacji dla U + FF10 FULLWIDTH DIGIT ZERO | ||||
Zobacz też
Bibliografia
- ^ "Baza danych znaków Unicode" . Standard Unicode . Pobrano 09.07.2016 .
- ^ „Wyliczone wersje standardu Unicode” . Standard Unicode . Pobrano 09.07.2016 .
- ^ Standardowa wersja Unicode 1.0, tom 1 . Addison-Wesley Publishing Company, Inc. 1990. ISBN 0-201-56788-1.
- ^ „3.8: Wykresy blok po bloku” (PDF) . Standard Unicode . wersja 1.0. Konsorcjum Unicode .
- ^ Sorting it all Out : Kiedy odwrotny ukośnik nie jest odwrotnym ukośnikiem?
- ^ B c d e f g "Unicode wykresy kod 6.2" (PDF) . Standard Unicode . Źródło 1 kwietnia 2013 .
- ^ Beeton, Barbara; Freytag, Asmus; Iancu, Laurențiu; Sargent, Murray (30.10.2015). „L2/15-268: Propozycja przedstawienia wariantu zerowego z przecięciem pustego zestawu” (PDF) .
- ^ B "UTS 51 EMOJI zmienności sekwencje" . Konsorcjum Unicode.
- ^ Edberg, Piotr (22.12.2011). „L2/11-438: Sekwencje wariacji emoji (wersja L2/11-429)” (PDF) .
- ^ Pournader, Roozbeh (01.11.2015). „L2/15-301: Propozycja 278 standardowych sekwencji odmian emoji” (PDF) .
- ^ "UTR #51: Unicode Emoji" . Konsorcjum Unicode. 2020-02-11.
- ^ „UCD: Dane Emoji dla UTR #51” . Konsorcjum Unicode. 2021-08-26.