VISCII - VISCII
MIME / IANA | VISCII |
---|---|
Języki) | wietnamski , angielski |
Stworzone przez | Grupa Viet-Std |
Definicje | RFC 1456 |
Klasyfikacja | 8-bitowy SBCS |
Oparte na | ASCII |
VISCII to nieoficjalnie zdefiniowane zmodyfikowane kodowanie znaków ASCII do używania na komputerach języka wietnamskiego . Nie należy go mylić z podobnie nazwanym oficjalnie zarejestrowanym kodowaniem VSCII . VISCII zachowuje niezmodyfikowanych 95 drukowalnych znaków ASCII, ale zastępuje 6 z 33 znaków kontrolnych znakami drukowalnymi. Dodaje 128 prekomponowanych znaków . Unicode i strona kodowa Windows-1258 są obecnie używane dla praktycznie wszystkich wietnamskich danych komputerowych, ale starsze pliki VSCII i VISCII mogą wymagać konwersji.
Historia i nazewnictwo
VISCII został zaprojektowany przez wietnamską Grupę Roboczą Normalizacyjną (Viet-Std Group) kierowaną przez Christophera Cuong T. Nguyen, Cuong M. Bui i Hoc D. Ngo z siedzibą w Dolinie Krzemowej w Kalifornii w 1992 roku, gdy pracowali z konsorcjum Unicode do zawierać wstępnie złożone znaki wietnamskie w standardzie Unicode. VISCII wraz z VIQR został po raz pierwszy opublikowany w dwujęzycznym raporcie we wrześniu 1992 roku, w którym został nazwany „Wietnamskim Standardowym Kodem Wymiany Informacji”. W raporcie odnotowano wzrost wykorzystania komputerów w Wietnamie i rosnącą liczbę komunikacji komputerowej wśród Wietnamczyków za granicą, że istniejące aplikacje wykorzystywały kodowanie specyficzne dla danego dostawcy, które nie było w stanie ze sobą współdziałać, a zatem konieczna była standaryzacja między dostawcami. Pomyślne włączenie skomponowanego i wstępnie skomponowanego języka wietnamskiego do Unicode 1.0 było wynikiem lekcji wyciągniętych z rozwoju 8-bitowego VISCII i 7-bitowego VIQR.
W następnym roku, w 1993 roku, Wietnam przyjął TCVN 5712 , swój pierwszy krajowy standard w dziedzinie technologii informatycznych . Ta określona postać kodujące nazwie VSCII , który został opracowany przez TCVN Komitetu Technicznego ds Technologii Informacyjnych (TCVN / TC1), oraz z jego nazwy stojącej za „wietnamskiego Norma Wymiany Informacji”. VSCII jest niezgodny i w inny sposób niezwiązany z wcześniej opublikowanym VISCII. W przeciwieństwie do VISCII, VSCII jest „standardem wietnamskim” w znaczeniu standardu krajowego .
VISCII i VIQR zostały zatwierdzone jako RFC 1456 o statusie informacyjnym , przypisywane grupie Viet-Std i datowane na maj 1993. Podobnie jak w przypadku RFC IETF, RFC 1456 określa je jako „konwencje” używane przez osoby posługujące się wietnamskim za granicą w Usenecie , i że „nie określa poziomu standardu”. Mimo to nadal nazywa VISCII „Wietnamskim Standardowym Kodem Wymiany Informacji” (ta sama nazwa przyjęta przez VSCII). Etykiety VISCII
i csVISCII
są zarejestrowane w IANA dla VISCII, w odniesieniu do RFC 1456. (Z drugiej strony nie ma oficjalnej etykiety IANA dla TCVN 5712 / VSCII, chociaż x-viet-tcvn5712
była wcześniej obsługiwana przez Mozilla Firefox .)
Projekt
Tradycyjny rozszerzony zestaw znaków ASCII składa się z zestawu ASCII plus do 128 znaków. Język wietnamski wymaga 134 dodatkowych kombinacji liter i znaków diakrytycznych, czyli o sześć za dużo. Istnieje (krótki spada poparcie znak ton literami, jak w VSCII-3 ), zasadniczo cztery różne sposoby, aby obsłużyć tego problemu:
- Użyj kodowania o zmiennej szerokości (podobnie jak UTF-8 )
- Uwzględnij łączenie znaków diakrytycznych dla znaków tonu (jak VSCII-2 i Windows-1258 ) lub ogólnie dla znaków diakrytycznych (jak ANSEL i VNI )
- Zastąp niektóre znaki interpunkcyjne ASCII, najlepiej interpunkcję, która nie jest niezmienna w ISO 646 (podobnie jak VNI dla DOS )
- Zastąp co najmniej sześć podstawowych znaków kontrolnych ASCII (podobnie jak VPS i VSCII-1 )
VISCII wybrał ostatnią opcję, zastępując sześć najmniej problematycznych (np. najmniej prawdopodobnych do rozpoznania przez aplikację i operujących na nich specjalnie) kodów kontrolnych C0 (STX, ENQ, ACK, DC4, EM i RS) sześcioma z najrzadziej używane kombinacje wielkich liter i znaków diakrytycznych. Chociaż ta opcja może powodować nieprawidłowe działanie programów korzystających z tych kodów sterujących podczas obsługi tekstu VISCII, powoduje to mniej komplikacji niż pozostałe dwie opcje (projektanci zauważają, że nie- 8-bitowa czysta transmisja okazała się w praktyce sprawiać więcej trudności niż kontroli ponownego wykorzystania znaków). Niemniej jednak lokalizacje zarówno znaków kontrolnych C0, jak i C1 oraz kody używane jako spacja nierozdzielająca w ISO-8859-1 , Mac OS Roman i OEM-US zostały celowo przypisane do wielkich liter, z zamiarem wykorzystania małych punktów kodowych z czcionką pisaną wyłącznie dużymi literami jest to możliwe do obsługi obejście, jeśli nie można wyświetlić znaków graficznych dla tych kodów.
Jednak wykorzystanie wszystkich rozszerzonych punktów kodowych dla liter akcentowanych nie pozostawia miejsca na dodawanie użytecznych symboli, liczb z indeksem górnym, cudzysłowów zakrzywionych, właściwych myślników itp., podobnie jak większość innych rozszerzonych zestawów znaków ASCII.
Lokalizacja znaków celowo głównie następujące ISO-8859-1 gdzie istnieją cech wspólnych między obu stronach Kodeksu (wielka Õ są odnotowane jako wyjątek), motywowane względami przyjazności dla użytkownika.
Wsparcie
VISCII jest częściowo wspierany przez TriChlor Software Group w Kalifornii, która wydała różne pakiety oprogramowania zgodne z VISCII, biblioteki i czcionki dla MS-DOS i Windows, Unix i Macintosh. Oprogramowanie zgodne z VISCII jest dostępne w wielu witrynach FTP .
VISCII był historycznie oferowany jako kodowanie poczty wychodzącej przez Mozilla Thunderbird . Był również obsługiwany przez oprogramowanie klawiatury wietnamskiej Windows, WinVNKey, stworzone przez Christophera Cuong T. Nguyen, a później zaktualizowane przez różne wersje Windows przez Hoc D. Ngo i innych.
VISCII był głównie używany przez osoby posługujące się wietnamem za granicą, przy czym VSCII (TCVN) był bardziej popularny w północnym Wietnamie, a VNI w południowym Wietnamie.
Zestaw znaków
_0 | _1 | _2 | _3 | _4 | _5 | _6 | _7 | _8 | _9 | _A | _B | _C | _D | _MI | _F | |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
0_ 0 |
NUL 0000 |
SOH 0001 |
1EB2 |
ETX 0003 |
EOT 0004 |
1EB4 |
1EAA |
BEL 0007 |
BS 0008 |
HT 0009 |
LF 000A |
VT 000B |
FF 000C |
CR 000D |
SO 000E |
SI 000F |
1_ 16 |
DLE 0010 |
DC1 0011 |
DC2 0012 |
DC3 0013 |
Y 1EF6 |
NAK 0015 |
SYN 0016 |
ETB 0017 |
MOŻE 0018 |
Y 1EF8 |
SUB 001A |
ESC 001B |
FS 001C |
GS 001D |
Y 1EF4 |
USA 001F |
2_ 32 |
SP 0020 |
! 0021 |
„ 0022 |
# 0023 |
0024 zł |
% 0025 |
& 0026 |
' 0027 |
( 0028 |
) 0029 |
* 002A |
+ 002B |
, 002C |
- 002D |
. 002E |
/ 002F |
3_ 48 |
0 0030 |
1 0031 |
2 0032 |
3 0033 |
4 0034 |
5 0035 |
6 0036 |
7 0037 |
8 0038 |
9 0039 |
: 003A |
; 003B |
< 003C |
= 003D |
> 003E |
? 003F |
4_ 64 |
@ 0040 |
0041 |
B 0042 |
C 0043 |
D 0044 |
E 0045 |
F 0046 |
G 0047 |
H 0048 |
I 0049 |
J 004A |
K 004B |
L 004C |
M 004D |
N 004E |
O 004F |
5_ 80 |
P 0050 |
P 0051 |
R 0052 |
S 0053 |
T 0054 |
U 0055 |
V 0056 |
W 0057 |
X 0058 |
Tak 0059 |
Z 005A |
[ 005B |
\ 005C |
] 005D |
^ 005E |
_ 005F |
6_ 96 |
` 0060 |
0061 |
b 0062 |
c 0063 |
d 0064 |
e 0065 |
f 0066 |
g 0067 |
h 0068 |
I 0069 |
j 006A |
k 006B |
L 006C |
m 006D |
n 006E |
o 006F |
7_ 112 |
p 0070 |
q 0071 |
R 0072 |
s 0073 |
t 0.074 |
U 0075 |
v 0076 |
w 0077 |
x 0078 |
y 0079 |
z 007A |
{ 007B |
| 007C |
} 007D |
~ 007E |
DEL 007F |
8_ 128 |
Ạ 1EA0 |
1EAE |
1EB0 |
1EB6 |
Ấ 1EA4 |
Ầ 1EA6 |
Ẩ 1EA8 |
Ậ 1EAC |
Ẽ 1EBC |
è 1EB8 |
è 1EBE |
Ề 1EC0 |
Ể 1EC2 |
Ễ 1EC4 |
Ệ 1EC6 |
ö 1ED0 |
9_ 144 |
ö 1ED2 |
ö 1ED4 |
ö 1ED6 |
ö 1ED8 |
Ợ 1EE2 |
Ớ 1EDA |
ö 1EDC |
ö 1EDE |
Ị 1ECA |
Ỏ 1 ECE |
Ọ 1ECC |
Ỉ 1EC8 |
ù 1EE6 |
Ũ 0168 |
ù 1EE4 |
Y 1EF2 |
A_ 160 |
Õ 00D5 |
ắ 1WŁ |
1EB1 |
1EB7 |
ấ 1EA5 |
ầ 1EA7 |
ẩ 1EA9 |
ậ 1EAD |
è 1EBD |
ẹ 1EB9 |
è 1EBF |
ề 1EC1 |
ể 1EC3 |
ễ 1EC5 |
ệ 1EC7 |
ö 1ED1 |
B_ 176 |
ồ 1ED3 |
ổ 1ED5 |
ỗ 1ED7 |
ö 1EE0 |
Ơ 01A0 |
ö 1ED9 |
ờ 1EDD |
ö 1EDF |
ị 1EBC |
ù 1EF0 |
ù 1EE8 |
Ừ 1EOG |
ù 1EEC |
ơ 01A1 |
ö 1EDB |
Ư 01AF |
C_ 192 |
À 00C0 |
Á 00C1 |
 00C2 |
à 00C3 |
Ả 1EA2 |
Ă 0102 |
1EB3 |
1EB5 |
È 00C8 |
É 00C9 |
Ę 00CA |
Ẻ 1EBA |
Ì 00CC |
Í 00CD |
Ĩ 0128 |
Y 1EF3 |
D_ 208 |
Đ 0110 |
ù 1EE9 |
Ò 00D2 |
Ó 00D3 |
Ô 00D4 |
ạ 1EA1 |
Y 1EF7 |
ù 1EEB |
ử 1 EED |
Ù 00D9 |
Ú 00DA |
ỹ 1EF9 |
Y 1EF5 |
Ý 00DD |
ö 1EE1 |
ư 01B0 |
E_ 224 |
à 00E0 |
á 00E1 |
â 00E2 |
ã 00E3 |
ả 1EA3 |
ă 0103 |
ữ 1 EEF |
ẫ 1EAB |
è 00E8 |
é 00E9 |
ê 00EA |
è 1EBB |
ì 00WE |
í 00ED |
ĩ 0129 |
í 1EC9 |
F_ 240 |
đ 0111 |
ự 1EF1 |
ò 00F2 |
ó 00F3 |
ô 00F4 |
õ 00F5 |
ỏ 1 ECF |
ö 1ECD |
ù 1EE5 |
ù 00F9 |
ú 00FA |
ũ 0169 |
ù 1EE7 |
ý 00FD |
ö 1EE3 |
Ữ 1EEE |
List Numer Interpunkcja Symbol Inne Nieokreślony
Różnice w stosunku do ISO-8859-1 są zacieniowane.
Zobacz też
- ASCII
- Cytowany w języku wietnamskim (VIQR)
- Wietnamski standardowy kod wymiany informacji (VSCII)
- Okna-1258
Bibliografia
Dalsza lektura
- Flohr, Guido (2016) [2006]. "Locale::RecodeData::VISCII — Procedury konwersji dla VISCII" . CPAN libintl-perl . Zarchiwizowane z oryginału dnia 2017-01-14 . Pobrano 14.01.2017 .
- https://www.math.nmsu.edu/~mleisher/Software/csets/VISCII.TXT
Zewnętrzne linki
- RFC 1456 — Konwencje dotyczące kodowania języka wietnamskiego
- Grupa Robocza ds. Standaryzacji Wietnamskiej z siedzibą w Kalifornii
- Raport Viet-Std 1992
- Oprogramowanie Angiang
- Oprogramowanie i czcionki zgodne z VISCII dla MS-DOS i Windows
- Oprogramowanie, biblioteki i czcionki zgodne z VISCII dla systemu Unix
- WinVNKey , wietnamski sterownik klawiatury dla systemu Windows obsługujący wielonarodowe zestawy znaków, w tym VISCII
- MacVNKey , sterownik klawiatury zgodny z VISCII dla klasycznego komputera Macintosh