Raqam
|
Jamoa
|
Qiymati
|
Raqam
|
Jamoa
|
Qiymati
|
0
|
Nul
|
Null ko'rsatkichi
|
10
|
Dle
|
Chiqish
|
1
|
SOH
|
sarlavha boshlanishi
|
11
|
DC1
|
Qurilmani boshqarish
|
2
|
STX
|
Matnning boshlanishi
|
12
|
DC2
|
Qurilmani boshqarish
|
3
|
ETX
|
Matnning oxiri
|
13
|
DC3
|
Qurilmani boshqarish
|
4
|
Eot
|
Uzatilishning oxiri
|
14
|
DC4
|
Qurilmani boshqarish
|
5
|
ACK
|
Talab
|
15
|
Nak
|
Rad qilish
|
6
|
Bel
|
Qabulni tasdiqlash
|
16
|
SYN
|
Oddiy
|
7
|
BS
|
Qo'ng'iroq belgisi
|
17
|
ETB
|
Uzatish moslamasining oxiri
|
8
|
Ht
|
Orqaga qaytish
|
18
|
MUMKIN
|
Belgilash
|
9
|
Lf
|
Gorizontal yorliq
|
19
|
EM
|
Medianing oxiri
|
A
|
VT
|
Chiziq tasmasi
|
1A
|
SUB
|
Subkript
|
B
|
Ff
|
Vertikal yorliq
|
1B
|
Esk
|
Chiqish
|
C
|
CR
|
Sahifani tarjima qilish
|
1C
|
FS
|
Fayl ajratuvchi
|
D
|
SO
|
Avtoulovni qaytarish
|
1D
|
GS
|
Guruh ajratuvchi
|
E
|
SI
|
Ikkilamchi registrga o'tish
|
1E
|
RS
|
Yozuvchi ajratuvchi
|
|
SI
|
Oddiy holatga o'tish
|
1F
|
AQSh
|
Modul ajratuvchi
|
Raqam
|
Belgi
|
Raqam
|
Belgi
|
Raqam
|
Belgi
|
Raqam
|
Belgi
|
Raqam
|
Belgi
|
Raqam
|
Belgi
|
20
|
bo'sh joy
|
30
|
0
|
40
|
@
|
50
|
P
|
60
|
.
|
70
|
p
|
21
|
!
|
31
|
1
|
41
|
A
|
51
|
Q
|
61
|
a
|
71
|
q
|
22
|
‘
|
32
|
2
|
42
|
B
|
52
|
R
|
62
|
b
|
72
|
r
|
23
|
#
|
33
|
3
|
43
|
C
|
53
|
S
|
63
|
v
|
73
|
s
|
24
|
φ
|
34
|
4
|
44
|
D
|
54
|
T
|
64
|
d
|
74
|
t
|
25
|
%
|
35
|
5
|
45
|
E
|
55
|
Va
|
65
|
e
|
75
|
va
|
26
|
&
|
36
|
6
|
46
|
F
|
56
|
V
|
66
|
f
|
76
|
v
|
27
|
‘
|
37
|
7
|
47
|
G
|
57
|
W
|
67
|
g
|
77
|
w
|
28
|
(
|
38
|
8
|
48
|
H
|
58
|
X
|
68
|
h
|
78
|
x
|
29
|
)
|
39
|
9
|
49
|
Men
|
59
|
Y
|
69
|
i
|
70
|
y
|
2A
|
‘
|
3A
|
;
|
4A
|
J
|
5A
|
Z
|
6A
|
j
|
7A
|
z
|
2B
|
+
|
3B
|
;
|
4B
|
K
|
5B
|
[
|
6B
|
k
|
7B
|
{
|
2C
|
‘
|
3C
|
<
|
4C
|
L
|
5C
|
\
|
6C
|
l
|
7C
|
|
|
2D
|
—
|
3D
|
=
|
4D
|
M
|
5D
|
]
|
6D
|
m
|
7D
|
}
|
2E
|
|
3E
|
>
|
4E
|
N
|
5E
|
—
|
6E
|
n
|
7E
|
~
|
2F
|
/
|
3F
|
g
|
4F
|
O
|
5F
|
_
|
6F
|
o
|
7F
|
DEL
| Unicode standarti
Oldingi kodlash ingliz uchun juda yaxshi, ammo boshqa tillar uchun bu qulay emas. Masalan, nemis tilida umlautlar, frantsuz tilida esa ustun belgilar mavjud. Ba'zi tillarda umuman alifbo mavjud. ASCII-ni kengaytirish uchun birinchi urinish IS646 edi, bu oldingi kodlashni boshqa 128 belgi bilan uzaytirdi. Urish va diakritikali lotin harflari qo'shildi va nom oldi - Lotin 1. Keyingi urinish IS 8859 edi - unda kod sahifasi mavjud edi. Uzaytirishga urinishlar hali ham bor edi, ammo bu universal emas edi. UNICODE kodlash dasturi (10646) yaratilgan. Kodlash g'oyasi har bir belgi uchun bitta doimiy 16 bitli qiymatni berishdir. kod ko'rsatgichi. Jami 65,536 ko'rsatkich. Joyni tejash uchun 0 -255 kodlari uchun Latin-1 kodi ishlatilgan, ASII-ni UNICODE-ga oson o'zgartirgan. Bunday standart ko'plab muammolarni hal qildi, ammo barchasi hammasi emas. Masalan, yapon tili uchun yangi so'zlarning kelishi bilan siz atamalar sonini 20 mingga ko'paytirishingiz kerak, shuningdek, brayl shriftini kiritishingiz kerak.
[8-bitli kodlash: ASCII, KOI-8R va CP1251] AQShda yaratilgan birinchi kodlash jadvallari sakkizinchi bitdan baytda foydalanmadi. Matn baytlarning ketma-ketligi sifatida taqdim etildi, ammo sakkizinchi bit hisobga olinmadi (rasmiy maqsadlarda ishlatilgan).
Jadval tan olingan standartga aylandi. Ascii (Ma'lumot almashish uchun Amerika standart kodi). ASCII jadvalining dastlabki 32 ta belgisi (00 dan 1F) bosib chiqarilmaydigan belgilar uchun ishlatilgan. Ular bosib chiqarish moslamasini va boshqalarni boshqarish uchun yaratilgan. Qolganlari - 20 dan 7F gacha - oddiy (bosma) belgilar.
1-jadval - ASCII kodlash
Dekabr
|
Hex
|
Oktabr
|
Char
|
Ta'rif
|
0
|
0
|
000
|
|
nol
|
1
|
1
|
001
|
|
sarlavhaning boshlanishi
|
2
|
2
|
002
|
|
matnning boshlanishi
|
3
|
3
|
003
|
|
matn oxirida
|
4
|
4
|
004
|
|
uzatishning oxiri
|
5
|
5
|
005
|
|
so'rov
|
6
|
6
|
006
|
|
tan olmoq
|
7
|
7
|
007
|
|
qo'ng'iroq
|
8
|
8
|
010
|
|
backspace
|
9
|
9
|
011
|
|
gorizontal yorliq
|
10
|
A
|
012
|
|
yangi chiziq
|
11
|
B
|
013
|
|
vertikal yorliq
|
12
|
C
|
014
|
|
yangi sahifa
|
13
|
D
|
015
|
|
avtoulovni qaytarish
|
14
|
E
|
016
|
|
siljitmoq
|
15
|
F
|
017
|
|
smenada
|
16
|
10
|
020
|
|
ma'lumotlar havolasi qochishi
|
17
|
11
|
021
|
|
asbobni boshqarish 1
|
18
|
12
|
022
|
|
asbobni boshqarish tugmasi 2
|
19
|
13
|
023
|
|
asbobni boshqarish moslamasi 3
|
20
|
14
|
024
|
|
asbobni boshqarish tugmasi 4
|
21
|
15
|
025
|
|
salbiy tan olish
|
22
|
16
|
026
|
|
sinxron bekor
|
23
|
17
|
027
|
|
transning oxiri blok
|
24
|
18
|
030
|
|
bekor qilish
|
25
|
19
|
031
|
|
o'rta oxir
|
26
|
1A
|
032
|
|
o'rnini bosuvchi
|
27
|
1B
|
033
|
|
qochish
|
28
|
1C
|
034
|
|
fayl ajratuvchi
|
29
|
1D
|
035
|
|
guruh ajratuvchi
|
30
|
1E
|
036
|
|
rekord ajratuvchi
|
31
|
1F
|
037
|
|
bo'linma
|
32
|
20
|
040
|
|
bo'sh joy
|
33
|
21
|
041
|
!
|
|
34
|
22
|
042
|
"
|
|
35
|
23
|
043
|
#
|
|
36
|
24
|
044
|
$
|
|
37
|
25
|
045
|
%
|
|
38
|
26
|
046
|
&
|
|
39
|
27
|
047
|
"
|
|
40
|
28
|
050
|
(
|
|
41
|
29
|
051
|
)
|
|
42
|
2A
|
052
|
*
|
|
43
|
2B
|
053
|
+
|
|
44
|
2C
|
054
|
,
|
|
45
|
2D
|
055
|
-
|
|
46
|
2E
|
056
|
.
|
|
47
|
2F
|
057
|
/
|
|
48
|
30
|
060
|
0
|
|
49
|
31
|
061
|
1
|
|
50
|
32
|
062
|
2
|
|
51
|
33
|
063
|
3
|
|
52
|
34
|
064
|
4
|
|
53
|
35
|
065
|
5
|
|
54
|
36
|
066
|
6
|
|
55
|
37
|
067
|
7
|
|
56
|
38
|
070
|
8
|
|
57
|
39
|
071
|
9
|
|
58
|
3A
|
072
|
:
|
|
59
|
3B
|
073
|
;
|
|
60
|
3C
|
074
|
<
|
|
61
|
3D
|
075
|
=
|
|
62
|
3E
|
076
|
>
|
|
63
|
3F
|
077
|
?
|
|
|
Dekabr
|
Hex
|
Oktabr
|
Char
|
64
|
40
|
100
|
@
|
65
|
41
|
101
|
A
|
66
|
42
|
102
|
B
|
67
|
43
|
103
|
C
|
68
|
44
|
104
|
D
|
69
|
45
|
105
|
E
|
70
|
46
|
106
|
F
|
71
|
47
|
107
|
G
|
72
|
48
|
110
|
H
|
73
|
49
|
111
|
Men
|
74
|
4A
|
112
|
J
|
75
|
4B
|
113
|
K
|
76
|
4C
|
114
|
L
|
77
|
4D
|
115
|
M
|
78
|
4E
|
116
|
N
|
79
|
4F
|
117
|
O
|
80
|
50
|
120
|
P
|
81
|
51
|
121
|
Q
|
82
|
52
|
122
|
R
|
83
|
53
|
123
|
S
|
84
|
54
|
124
|
T
|
85
|
55
|
125
|
U
|
86
|
56
|
126
|
V
|
87
|
57
|
127
|
W
|
88
|
58
|
130
|
X
|
89
|
59
|
131
|
Y
|
90
|
5A
|
132
|
Z
|
91
|
5B
|
133
|
[
|
92
|
5C
|
134
|
\
|
93
|
5D
|
135
|
]
|
94
|
5E
|
136
|
^
|
95
|
5F
|
137
|
_
|
96
|
60
|
140
|
`
|
97
|
61
|
141
|
a
|
98
|
62
|
142
|
b
|
99
|
63
|
143
|
v
|
100
|
64
|
144
|
d
|
101
|
65
|
145
|
e
|
102
|
66
|
146
|
f
|
103
|
67
|
147
|
g
|
104
|
68
|
150
|
h
|
105
|
69
|
151
|
i
|
106
|
6A
|
152
|
j
|
107
|
6B
|
153
|
k
|
108
|
6C
|
154
|
l
|
109
|
6D
|
155
|
m
|
110
|
6E
|
156
|
n
|
111
|
6F
|
157
|
o
|
112
|
70
|
160
|
p
|
113
|
71
|
161
|
q
|
114
|
72
|
162
|
r
|
115
|
73
|
163
|
s
|
116
|
74
|
164
|
t
|
117
|
75
|
165
|
u
|
118
|
76
|
166
|
v
|
119
|
77
|
167
|
w
|
120
|
78
|
170
|
x
|
121
|
79
|
171
|
y
|
122
|
7A
|
172
|
z
|
123
|
7B
|
173
|
{
|
124
|
7C
|
174
|
|
|
125
|
7D
|
175
|
}
|
126
|
7E
|
176
|
~
|
127
|
7F
|
177
|
DEL
|
|
Ko'rinib turibdiki, ushbu kodlashda faqat lotin harflari va ingliz tilida ishlatiladigan harflar ko'rsatilgan. Bundan tashqari, arifmetik va boshqa yordamchi belgilar mavjud. Ammo ruscha harflar, hatto nemis yoki frantsuz uchun maxsus lotin mavjud emas. Buni tushuntirish juda oson - kodlash maxsus Amerika standarti sifatida ishlab chiqilgan. Dunyo bo'ylab kompyuterlardan foydalanishni boshlaganda, boshqa belgilarni kodlash kerak edi.
Buning uchun har baytda sakkizinchi bitdan foydalanishga qaror qilindi. Shunday qilib, belgilarni kodlash uchun ishlatilishi mumkin bo'lgan yana 128 qiymat (80 dan FF gacha) mavjud edi. Sakkiz bitli jadvallarning birinchisi - "Advanced ASCII" ( Kengaytirilgan ASCII) - G'arbiy Evropaning ba'zi tillarida ishlatiladigan lotin harflarining turli xil variantlarini o'z ichiga olgan. Bundan tashqari, boshqa qo'shimcha belgilar, shu jumladan soxta grafika ham bor edi.
Psevdografik belgilar faqat matn belgilarini aks ettirishga biron bir grafikani taqdim etishga imkon beradi. Pseudografikadan foydalanish, masalan, FAR Manager fayllarni boshqarish dasturi ishlaydi.
Kengaytirilgan ASCII jadvalida ruscha harflar yo'q edi. Rossiyada (sobiq SSSR) va boshqa shtatlarda o'ziga xos "milliy" belgilarni 8 bitli matnli fayllarda - polyak va chex tillarining lotin harflari, kirill (rus tilidagi harflar) va boshqa alifbolarda aks ettirishga imkon beradigan o'z kodirovkalari yaratildi.
Tarqalishga erishgan barcha kodlashlarda birinchi 127 belgi (ya'ni sakkizinchi bit 0 ga teng bayt qiymatlari) ASCII bilan bir xil. Shunday qilib, ASCII fayli ushbu kodlarning har qandayida ishlaydi; ingliz tilidagi harflar xuddi shu tarzda taqdim etiladi.
Tashkilot ISO (Xalqaro standartlashtirish tashkiloti - standartlar guruhini qabul qildi ISO 8859. Turli xil tillar guruhlari uchun 8 bitli kodlashni aniqlaydi. Shunday qilib, ISO 8859-1 - kengaytirilgan ASCII, AQSh va G'arbiy Evropa uchun jadval. Va ISO 8859-5 - bu kirill alifbosi uchun jadval (shu jumladan rus tilida).
Ammo, tarixiy sabablarga ko'ra, ISO 8859-5 kodlashi ildiz otmadi. Aslida rus tili uchun quyidagi kodlashlardan foydalaniladi:
Kod sahifasi 866 ( CP866), shuningdek, "DOS", shuningdek "GOSTning alternativ kodlashi". U 90-yillarning o'rtalariga qadar keng qo'llanilgan; endi cheklangan foydalanish. Internetda matnlarni tarqatishda amalda qo'llanilmaydi.
- KOI-8. 70-80-yillarda ishlab chiqilgan. Rossiya Internetida elektron pochta xabarlarini yuborish uchun umumiy qabul qilingan standart. Bundan tashqari, Unix oilasining operatsion tizimlarida, shu jumladan Linuxda keng qo'llaniladi. Rus tiliga mo'ljallangan KOI-8 versiyasi deyiladi KOI-8R; Boshqa kirill tillari uchun versiyalar mavjud (masalan, KOI8-U ukrain tiliga mos keladi).
- Kod 1251, CP1251, Windows-1251. Windows tizimida rus tilini qo'llab-quvvatlash uchun Microsoft tomonidan ishlab chiqilgan.
CP866 ning asosiy ustunligi kengaytirilgan ASCII-dagi kabi joylarda soxta grafik belgilarning saqlanishi; shuning uchun xorijiy matn dasturlari, masalan, mashhur Norton qo'mondoni, o'zgarishsiz ishlashi mumkin edi. Endi CP866 matnli oynalarda yoki to'liq ekranli rejimda ishlaydigan Windows dasturlari uchun, shu jumladan FAR menejeri uchun ishlatiladi.
So'nggi yillarda CP866-dagi matnlar juda kam uchraydi (lekin Windows-da rus fayl nomlarini kodlash uchun ishlatiladi). Shuning uchun biz boshqa ikkita kodlash to'g'risida to'xtalamiz - KOI-8R va CP1251.
Ko'rinib turibdiki, kodlash jadvalida CP1251 ruscha harflar alifbo tartibida joylashtirilgan (ammo, yo harfidan tashqari). Ushbu tartibga solish tufayli kompyuter dasturlarini alfavit bo'yicha tartiblash juda oson.
Ammo KOI-8R-da ruscha harflar tartibi tasodifiy ko'rinadi. Ammo aslida bu unday emas.
Ko'plab eski dasturlarda matnni qayta ishlash yoki uzatish paytida 8-chi bit yo'qoldi. (Endi bunday dasturlar deyarli yo'q bo'lib ketdi, ammo 80-yillarning oxiri va 90-yillarning boshlarida ular keng tarqaldi). 8 bitli qiymatdan 7 bitli qiymatni olish uchun etakchi raqamdan 8 ni olish kifoya qiladi; masalan, E1 61 ga aylanadi.
Endi KOI-8R ni ASCII jadvali bilan taqqoslang (1-jadval). Siz rus harflari Lotin harflari bilan aniq mos kelishini topasiz. Agar sakkizinchi bit yo'qolsa, ruscha kichik harflar katta lotin harflariga, katta ruscha - kichik lotin harflariga aylanadi. Shunday qilib, KOI-8-dagi E1 ruscha "A" dir, ASCII-dagi 61 - lotincha "a".
Shunday qilib, KOI-8 sizga 8-bitni yo'qotish bilan rus tilidagi matnni o'qilishini ta'minlashga imkon beradi. "Hammaga salom" "PRIWET WSEM" ga aylanadi.
So'nggi paytlarda kodlash jadvalidagi harflarning alfavit tartibini va 8-bitni yo'qotgan holda o'qilishi hal qiluvchi ahamiyatini yo'qotdi. Zamonaviy kompyuterlardagi sakkizinchi bit uzatish yoki qayta ishlash paytida yo'qolmaydi. Alifbo tartibida tartiblash kodlarni oddiy taqqoslashni emas, balki kodlashni hisobga olgan holda amalga oshiriladi. (Aytgancha, CP1251 kodlari to'liq alifbo tartibida emas - yo harfi o'z o'rnida emas).
Internet bilan ishlashda (pochta, veb-saytlarni ko'rib chiqish) ikkita umumiy kodlash mavjud bo'lganligi sababli, ba'zida ruscha matn o'rniga ma'nosiz harflar to'plamini ko'rishingiz mumkin. Masalan, "Men SBUFEMHEL". Bu "hurmat" so'zlari; ammo ular CP1251 kodlashda kodlangan va kompyuter KOI-8 jadvaliga muvofiq matnni dekodladi. Agar xuddi shu so'zlar, aksincha, KOI-8-da kodlangan bo'lsa va kompyuter CP1251 jadvaliga muvofiq matnni dekodlagan bo'lsa, natija "UCHCHTSEOYEN" bo'ladi.
Ba'zan kompyuterda rus tilidagi harflarning rus tiliga mo'ljallanmagan jadvalga ko'ra ham shifrlanishi sodir bo'ladi. Keyin rus harflari o'rniga ma'nosiz belgilar to'plami paydo bo'ladi (masalan, Sharqiy Evropa tillarining lotin harflari); ular ko'pincha "timsohlar" deb nomlanadi.
Ko'pgina hollarda, zamonaviy dasturlar Internetdagi hujjatlar (elektron pochta va veb-sahifalar) kodlarini mustaqil ravishda aniqlash bilan kurashadilar. Ammo ba'zida ular "ishlamayapti", keyin biz rus harflarining yoki "kroko-zabralarning" g'alati ketma-ketligini ko'rishimiz mumkin. Qoida tariqasida, bunday vaziyatda haqiqiy matnni ko'rsatish uchun dastur menyusida qo'lda kodlashni tanlash kifoya.
Maqola uchun http://open-office.edusite.ru/TextProcessor/p5aa1.html sahifasining ma'lumotlari ishlatilgan.
Saytdan olingan materiallar:
Ma'lumki, kompyuter ma'lumotni ikkilik shaklida saqlaydi, bu ma'lumotlar va nollarni ketma-ketligi sifatida ifodalaydi. Ma'lumotni odamni idrok qilish uchun qulay shaklga aylantirish uchun, har bir noyob raqamlar ketma-ketligi tegishli belgilar bilan almashtiriladi.
Ikkilik kodlarning bosma va boshqarish belgilariga nisbati tizimlaridan biri bu
Kompyuter texnologiyalarining hozirgi rivojlanish darajasida foydalanuvchi har bir o'ziga xos belgi kodini bilishi shart emas. Ammo kodlash qanday amalga oshirilayotganligi haqida umumiy tushuncha juda foydali va hatto ba'zi toifadagi mutaxassislar uchun zarurdir.
Do'stlaringiz bilan baham: |