Mavzu bo'yicha mustaqil o'rganish uchun 2-ma'ruza
Kodlash Ascii
ASCII kodlar jadvali (ASCII - ma'lumot almashish uchun Amerika standart kodi).
Hammasi bo'lib, ASCII kodlash jadvalidan foydalanib (1-rasm), 256 xil belgilarni kodlash mumkin. Ushbu jadval ikki qismga bo'linadi: asosiy (OOh dan 7Fh gacha bo'lgan kodlar bilan) va qo'shimcha (80h dan FFh gacha, bu erda h harfi o'n oltilik raqamlar tizimiga tegishli ekanligini ko'rsatadi).
1-rasm
Jadvaldan bitta belgini kodlash uchun 8 bit (1 bayt) ajratilgan. Matnli ma'lumotlarga ishlov berishda bir bayt ba'zi belgilar kodlarini - harflar, raqamlar, tinish belgilari, harakatlar belgilari va boshqalarni o'z ichiga olishi mumkin. Har bir belgi butun son shaklida o'z kodiga ega. Bunday holda, barcha kodlar kodlash deb nomlangan maxsus jadvallarda to'planadi. Ularning yordami bilan ramz kodi monitor ekranida ko'rinadigan ko'rinishga aylantiriladi. Natijada, kompyuter xotirasidagi har qanday matn belgilar kodlari bilan baytlar ketma-ketligi sifatida taqdim etiladi.
Masalan, salom so'zi! quyidagicha kodlanadi (jadval 1).
1-jadval
1-rasm standart (ingliz) va kengaytirilgan (ruscha) ASCII kodlash tizimiga kiritilgan belgilarni ko'rsatadi.
ASCII jadvalining birinchi yarmi standartlashtirilgan. Unda nazorat kodlari mavjud (soat 00 dan 20 soat va 77 soatgacha). Ushbu kodlar jadval elementlaridan o'chirildi, chunki ular matn elementlariga taalluqli emas. Tinish va matematik belgilar ham bu erda joylashtirilgan: 2lh -!, 26h - &, 28h - (, 2Bh - +, ..., katta va kichik lotin harflari: 41h - A, 61h - a.
Jadvalning ikkinchi yarmida milliy shriftlar, pseudografik belgilar, jadvallar qurilishi mumkin bo'lgan maxsus matematik belgilar mavjud. Kodlash jadvalining pastki qismi tegishli drayverlar - boshqaruv yordamchi dasturlari yordamida o'zgartirilishi mumkin. Ushbu uslub sizga bir nechta shriftlarni va ularning eshitish vositalarini ishlatishga imkon beradi.
Har bir ramz kodi uchun displeyda ramzning tasviri ko'rsatilishi kerak - bu nafaqat raqamli kodni, balki mos keladigan tasvirni ham aks ettirishi kerak, chunki har bir belgi o'z shakliga ega. Har bir belgi shaklining tavsifi maxsus displey xotirasida - belgilar generatorida saqlanadi. Belgini IBM PC displeyida yoritish, masalan, ramz matritsasini tashkil etuvchi nuqta yordamida amalga oshiriladi. Bunday matritsadagi har bir piksel tasvir elementidir va yorqin yoki qorong'i bo'lishi mumkin. Qorong'u nuqta 0 raqami bilan kodlangan, yorug'lik (yorqin) - 1. Agar siz qoramtir piksellarni belgining matritsa maydonida va yulduzcha bilan yorqin piksellarni ko'rsatsangiz, siz belgining shaklini grafik ravishda tasvirlashingiz mumkin.
Turli mamlakatlardagi odamlar o'z ona tillarining so'zlarini yozish uchun belgilar ishlatadilar. Hozirgi kunda ko'pgina ilovalar, jumladan elektron pochta tizimlari va veb-brauzerlar faqat 8 bitli, ya'ni faqat ISO-8859-1 standartiga muvofiq 8-bitli belgilarni ko'rsatishi va to'g'ri qabul qilishi mumkin.
Dunyoda 256 dan ortiq belgilar mavjud (kirill, arab, xitoy, yapon, koreys va tailand tillarini hisobga olgan holda) va yana yangi belgilar paydo bo'lmoqda. Va bu ko'plab foydalanuvchilar uchun quyidagi bo'sh joylarni yaratadi:
Bitta hujjatda turli xil belgilar to'plamidagi belgilarni ishlatish mumkin emas. Har bir matnli hujjat o'zining kodlash to'plamidan foydalanganligi sababli, matnni avtomatik aniqlashda katta qiyinchiliklar mavjud.
Yangi belgilar paydo bo'ladi (masalan: Evro), buning natijasida ISO ISO-8859-1 standartiga juda o'xshash yangi ISO-8859-15 standartini ishlab chiqmoqda. Farq quyidagicha: eski ISO-8859-1 kodlash jadvalidan yangi paydo bo'lgan ramzlarga (masalan, evroga) joy ajratish uchun hozirda foydalanilmayotgan eski valyutalarning belgilari olib tashlandi. Natijada, foydalanuvchilar disklarda bir xil hujjatlarga ega bo'lishlari mumkin, ammo turli xil kodlashlarda. Ushbu muammolarning echimi universal kodlash yoki Unicode deb nomlangan yagona xalqaro kodlash to'plamini qabul qilishdir.
Do'stlaringiz bilan baham: |