Сборка от 17 марта 2017 г



Download 9,9 Mb.
bet104/349
Sana26.04.2022
Hajmi9,9 Mb.
#582433
TuriУчебник
1   ...   100   101   102   103   104   105   106   107   ...   349
Bog'liq
ilja kantor sovremennyj uchebnik-1chast PdfToWord

Кодировка Юникод


Как мы знаем, символы сравниваются в алфавитном порядке 'А' < 'Б' < 'В' < ... < 'Я' . Но есть несколько странностей…



  1. Почему буква 'а' маленькая больше буквы 'Я' большой?

alert( 'а' > 'Я' ); // true





  1. Буква 'ё' находится в алфавите между е и ж : абвгдеёжз… . Но почему тогда 'ё' больше 'я' ?

alert( 'ё' > 'я' ); // true


Чтобы разобраться с этим, обратимся к внутреннему представлению строк в JavaScript.




Все строки имеют внутреннюю кодировку Юникод .

Неважно, на каком языке написана страница, находится ли она в windows‑1251 или utf‑8. Внутри JavaScript‑интерпретатора все строки приводятся к единому «юникодному» виду. Каждому символу соответствует свой код.


Есть метод для получения символа по его коду:


String.fromCharCode(code)

Возвращает символ по коду code :

alert( String.fromCharCode(1072) ); // 'а'


…И метод для получения цифрового кода из символа:


str.charCodeAt(pos)

Возвращает код символа на позиции pos . Отсчет позиции начинается с нуля.

alert( "абрикос".charCodeAt(0) ); // 1072, код 'а'


Теперь вернемся к примерам выше. Почему сравнения 'ё' > 'я' и 'а' > 'Я' дают такой странный результат?


Дело в том, что символы сравниваются не по алфавиту, а по коду. У кого код больше – тот и больше. В юникоде есть много разных символов. Кириллическим буквам соответствует только небольшая часть из них, подробнее – Кириллица в Юникоде .


Выведем отрезок символов юникода с кодами от 1034 до 1113 :

var str = '';


for (var i = 1034; i <= 1113; i++) { str += String.fromCharCode(i);
}
alert( str );

Результат:


ЊЋЌЍЎЏАБВГДЕЖЗИЙКЛМНОПРСТУФХЦЧШЩЪЫЬЭЮЯабвгдежзийклмнопрстуфхцчшщъыьэюяѐёђѓєѕіїјљ


Мы можем увидеть из этого отрезка две важных вещи:


  1. Строчные буквы идут после заглавных, поэтому они всегда больше.

В частности, 'а'(код 1072) > 'Я'(код 1071) .


То же самое происходит и в английском алфавите, там 'a' > 'Z' .




  1. Ряд букв, например ё , находятся вне основного алфавита.

В частности, маленькая буква ё имеет код, больший чем я , поэтому 'ё'(код 1105) > 'я'(код 1103) .


Кстати, большая буква Ё располагается в Unicode до А , поэтому 'Ё' (код 1025) < 'А' (код 1040). Удивительно: есть буква меньше чем А :)




Буква ё не уникальна, точки над буквой используются и в других языках, приводя к тому же результату.

Например, при работе с немецкими названиями:


alert( "ö" > "z" ); // true






Download 9,9 Mb.

Do'stlaringiz bilan baham:
1   ...   100   101   102   103   104   105   106   107   ...   349




Ma'lumotlar bazasi mualliflik huquqi bilan himoyalangan ©hozir.org 2024
ma'muriyatiga murojaat qiling

kiriting | ro'yxatdan o'tish
    Bosh sahifa
юртда тантана
Боғда битган
Бугун юртда
Эшитганлар жилманглар
Эшитмадим деманглар
битган бодомлар
Yangiariq tumani
qitish marakazi
Raqamli texnologiyalar
ilishida muhokamadan
tasdiqqa tavsiya
tavsiya etilgan
iqtisodiyot kafedrasi
steiermarkischen landesregierung
asarlaringizni yuboring
o'zingizning asarlaringizni
Iltimos faqat
faqat o'zingizning
steierm rkischen
landesregierung fachabteilung
rkischen landesregierung
hamshira loyihasi
loyihasi mavsum
faolyatining oqibatlari
asosiy adabiyotlar
fakulteti ahborot
ahborot havfsizligi
havfsizligi kafedrasi
fanidan bo’yicha
fakulteti iqtisodiyot
boshqaruv fakulteti
chiqarishda boshqaruv
ishlab chiqarishda
iqtisodiyot fakultet
multiservis tarmoqlari
fanidan asosiy
Uzbek fanidan
mavzulari potok
asosidagi multiservis
'aliyyil a'ziym
billahil 'aliyyil
illaa billahil
quvvata illaa
falah' deganida
Kompyuter savodxonligi
bo’yicha mustaqil
'alal falah'
Hayya 'alal
'alas soloh
Hayya 'alas
mavsum boyicha


yuklab olish