VISCII - VISCII

VISCII
MIME / IANA VISCII
Języki) wietnamski , angielski
Stworzone przez Grupa Viet-Std
Definicje RFC  1456
Klasyfikacja 8-bitowy SBCS
Oparte na ASCII

VISCII to nieoficjalnie zdefiniowane zmodyfikowane kodowanie znaków ASCII do używania na komputerach języka wietnamskiego . Nie należy go mylić z podobnie nazwanym oficjalnie zarejestrowanym kodowaniem VSCII . VISCII zachowuje niezmodyfikowanych 95 drukowalnych znaków ASCII, ale zastępuje 6 z 33 znaków kontrolnych znakami drukowalnymi. Dodaje 128 prekomponowanych znaków . Unicode i strona kodowa Windows-1258 są obecnie używane dla praktycznie wszystkich wietnamskich danych komputerowych, ale starsze pliki VSCII i VISCII mogą wymagać konwersji.

Historia i nazewnictwo

VISCII został zaprojektowany przez wietnamską Grupę Roboczą Normalizacyjną (Viet-Std Group) kierowaną przez Christophera Cuong T. Nguyen, Cuong M. Bui i Hoc D. Ngo z siedzibą w Dolinie Krzemowej w Kalifornii w 1992 roku, gdy pracowali z konsorcjum Unicode do zawierać wstępnie złożone znaki wietnamskie w standardzie Unicode. VISCII wraz z VIQR został po raz pierwszy opublikowany w dwujęzycznym raporcie we wrześniu 1992 roku, w którym został nazwany „Wietnamskim Standardowym Kodem Wymiany Informacji”. W raporcie odnotowano wzrost wykorzystania komputerów w Wietnamie i rosnącą liczbę komunikacji komputerowej wśród Wietnamczyków za granicą, że istniejące aplikacje wykorzystywały kodowanie specyficzne dla danego dostawcy, które nie było w stanie ze sobą współdziałać, a zatem konieczna była standaryzacja między dostawcami. Pomyślne włączenie skomponowanego i wstępnie skomponowanego języka wietnamskiego do Unicode 1.0 było wynikiem lekcji wyciągniętych z rozwoju 8-bitowego VISCII i 7-bitowego VIQR.

W następnym roku, w 1993 roku, Wietnam przyjął TCVN 5712 , swój pierwszy krajowy standard w dziedzinie technologii informatycznych . Ta określona postać kodujące nazwie VSCII , który został opracowany przez TCVN Komitetu Technicznego ds Technologii Informacyjnych (TCVN / TC1), oraz z jego nazwy stojącej za „wietnamskiego Norma Wymiany Informacji”. VSCII jest niezgodny i w inny sposób niezwiązany z wcześniej opublikowanym VISCII. W przeciwieństwie do VISCII, VSCII jest „standardem wietnamskim” w znaczeniu standardu krajowego .

VISCII i VIQR zostały zatwierdzone jako RFC  1456 o statusie informacyjnym , przypisywane grupie Viet-Std i datowane na maj 1993. Podobnie jak w przypadku RFC IETF, RFC 1456 określa je jako „konwencje” używane przez osoby posługujące się wietnamskim za granicą w Usenecie , i że „nie określa poziomu standardu”. Mimo to nadal nazywa VISCII „Wietnamskim Standardowym Kodem Wymiany Informacji” (ta sama nazwa przyjęta przez VSCII). Etykiety VISCIIi csVISCIIsą zarejestrowane w IANA dla VISCII, w odniesieniu do RFC 1456. (Z drugiej strony nie ma oficjalnej etykiety IANA dla TCVN 5712 / VSCII, chociaż x-viet-tcvn5712była wcześniej obsługiwana przez Mozilla Firefox .)

Projekt

Tradycyjny rozszerzony zestaw znaków ASCII składa się z zestawu ASCII plus do 128 znaków. Język wietnamski wymaga 134 dodatkowych kombinacji liter i znaków diakrytycznych, czyli o sześć za dużo. Istnieje (krótki spada poparcie znak ton literami, jak w VSCII-3 ), zasadniczo cztery różne sposoby, aby obsłużyć tego problemu:

  1. Użyj kodowania o zmiennej szerokości (podobnie jak UTF-8 )
  2. Uwzględnij łączenie znaków diakrytycznych dla znaków tonu (jak VSCII-2 i Windows-1258 ) lub ogólnie dla znaków diakrytycznych (jak ANSEL i VNI )
  3. Zastąp niektóre znaki interpunkcyjne ASCII, najlepiej interpunkcję, która nie jest niezmienna w ISO 646 (podobnie jak VNI dla DOS )
  4. Zastąp co najmniej sześć podstawowych znaków kontrolnych ASCII (podobnie jak VPS i VSCII-1 )

VISCII wybrał ostatnią opcję, zastępując sześć najmniej problematycznych (np. najmniej prawdopodobnych do rozpoznania przez aplikację i operujących na nich specjalnie) kodów kontrolnych C0 (STX, ENQ, ACK, DC4, EM i RS) sześcioma z najrzadziej używane kombinacje wielkich liter i znaków diakrytycznych. Chociaż ta opcja może powodować nieprawidłowe działanie programów korzystających z tych kodów sterujących podczas obsługi tekstu VISCII, powoduje to mniej komplikacji niż pozostałe dwie opcje (projektanci zauważają, że nie- 8-bitowa czysta transmisja okazała się w praktyce sprawiać więcej trudności niż kontroli ponownego wykorzystania znaków). Niemniej jednak lokalizacje zarówno znaków kontrolnych C0, jak i C1 oraz kody używane jako spacja nierozdzielająca w ISO-8859-1 , Mac OS Roman i OEM-US zostały celowo przypisane do wielkich liter, z zamiarem wykorzystania małych punktów kodowych z czcionką pisaną wyłącznie dużymi literami jest to możliwe do obsługi obejście, jeśli nie można wyświetlić znaków graficznych dla tych kodów.

Jednak wykorzystanie wszystkich rozszerzonych punktów kodowych dla liter akcentowanych nie pozostawia miejsca na dodawanie użytecznych symboli, liczb z indeksem górnym, cudzysłowów zakrzywionych, właściwych myślników itp., podobnie jak większość innych rozszerzonych zestawów znaków ASCII.

Lokalizacja znaków celowo głównie następujące ISO-8859-1 gdzie istnieją cech wspólnych między obu stronach Kodeksu (wielka Õ są odnotowane jako wyjątek), motywowane względami przyjazności dla użytkownika.

Wsparcie

VISCII jest częściowo wspierany przez TriChlor Software Group w Kalifornii, która wydała różne pakiety oprogramowania zgodne z VISCII, biblioteki i czcionki dla MS-DOS i Windows, Unix i Macintosh. Oprogramowanie zgodne z VISCII jest dostępne w wielu witrynach FTP .

VISCII był historycznie oferowany jako kodowanie poczty wychodzącej przez Mozilla Thunderbird . Był również obsługiwany przez oprogramowanie klawiatury wietnamskiej Windows, WinVNKey, stworzone przez Christophera Cuong T. Nguyen, a później zaktualizowane przez różne wersje Windows przez Hoc D. Ngo i innych.

VISCII był głównie używany przez osoby posługujące się wietnamem za granicą, przy czym VSCII (TCVN) był bardziej popularny w północnym Wietnamie, a VNI w południowym Wietnamie.

Zestaw znaków

VISCII
_0 _1 _2 _3 _4 _5 _6 _7 _8 _9 _A _B _C _D _MI _F
0_
0
NUL
0000
SOH
0001

1EB2
ETX
0003
EOT
0004

1EB4

1EAA
BEL
0007
BS
0008
HT
0009
LF
000A
VT
000B
FF
000C
CR
000D
SO
000E
SI
000F
1_
16
DLE
0010
DC1
0011
DC2
0012
DC3
0013
Y
1EF6
NAK
0015
SYN
0016
ETB
0017
MOŻE
0018
Y
1EF8
SUB
001A
ESC
001B
FS
001C
GS
001D
Y
1EF4
USA
001F
2_
32
SP
0020
!
0021

0022
#
0023
0024
%
0025
&
0026
'
0027
(
0028
)
0029
*
002A
+
002B
,
002C
-
002D
.
002E
/
002F
3_
48
0
0030
1
0031
2
0032
3
0033
4
0034
5
0035
6
0036
7
0037
8
0038
9
0039
:
003A
;
003B
<
003C
=
003D
>
003E
?
003F
4_
64
@
0040

0041
B
0042
C
0043
D
0044
E
0045
F
0046
G
0047
H
0048
I
0049
J
004A
K
004B
L
004C
M
004D
N
004E
O
004F
5_
80
P
0050
P
0051
R
0052
S
0053
T
0054
U
0055
V
0056
W
0057
X
0058
Tak
0059
Z
005A
[
005B
\
005C
]
005D
^
005E
_
005F
6_
96
`
0060

0061
b
0062
c
0063
d
0064
e
0065
f
0066
g
0067
h
0068
I
0069
j
006A
k
006B
L
006C
m
006D
n
006E
o
006F
7_
112
p
0070
q
0071
R
0072
s
0073
t
0.074
U
0075
v
0076
w
0077
x
0078
y
0079
z
007A
{
007B
|
007C
}
007D
~
007E
DEL
007F
8_
128

1EA0

1EAE

1EB0

1EB6

1EA4

1EA6

1EA8

1EAC

1EBC
è
1EB8
è
1EBE

1EC0

1EC2

1EC4

1EC6
ö
1ED0
9_
144
ö
1ED2
ö
1ED4
ö
1ED6
ö
1ED8

1EE2

1EDA
ö
1EDC
ö
1EDE

1ECA
Ỏ 1
ECE

1ECC

1EC8
ù
1EE6
Ũ
0168
ù
1EE4
Y
1EF2
A_
160
Õ
00D5

1WŁ

1EB1

1EB7

1EA5

1EA7

1EA9

1EAD
è
1EBD

1EB9
è
1EBF

1EC1

1EC3

1EC5

1EC7
ö
1ED1
B_
176

1ED3

1ED5

1ED7
ö
1EE0
Ơ
01A0
ö
1ED9

1EDD
ö
1EDF

1EBC
ù
1EF0
ù
1EE8

1EOG
ù
1EEC
ơ
01A1
ö
1EDB
Ư
01AF
C_
192
À
00C0
Á
00C1
Â
00C2
Ã
00C3

1EA2
Ă
0102

1EB3

1EB5
È
00C8
É
00C9
Ę
00CA

1EBA
Ì
00CC
Í
00CD
Ĩ
0128
Y
1EF3
D_
208
Đ
0110
ù
1EE9
Ò
00D2
Ó
00D3
Ô
00D4

1EA1
Y
1EF7
ù
1EEB
ử 1
EED
Ù
00D9
Ú
00DA

1EF9
Y
1EF5
Ý
00DD
ö
1EE1
ư
01B0
E_
224
à
00E0
á
00E1
â
00E2
ã
00E3

1EA3
ă
0103
ữ 1
EEF

1EAB
è
00E8
é
00E9
ê
00EA
è
1EBB
ì
00WE
í
00ED
ĩ
0129
í
1EC9
F_
240
đ
0111

1EF1
ò
00F2
ó
00F3
ô
00F4
õ
00F5
ỏ 1
ECF
ö
1ECD
ù
1EE5
ù
00F9
ú
00FA
ũ
0169
ù
1EE7
ý
00FD
ö
1EE3

1EEE

  List  Numer  Interpunkcja  Symbol  Inne  Nieokreślony

Różnice w stosunku do ISO-8859-1 są zacieniowane.

Zobacz też

Bibliografia

Dalsza lektura

Zewnętrzne linki