Часть VI. Linux на сервере
зеркалирование, когда есть два накопителя, и записываемые данные дублируются
на каждый из дисков массива. Самый популярный из уровней — RAID 5. Он более
экономичен— данные распределяются по всем дискам массива, минимальное
количество дисков — три.
Экономичным этот уровень делает то обстоятельство, что при нем больше про-
странства остается именно под запись данных (особенно, по сравнению с RAID 1).
Характерное свойство уровня RAID 5 заключается в том, что он обеспечивает
посредственную скорость записи, зато отличное время чтения, поскольку потоки
данных с нескольких накопителей массива распараллеливаются.
Основные недостатки технологии RAID и всех решений, построенных на ней, сле-
дующие:
□
плохая масштабируемость
— вы только вдумайтесь, технология создава-
лась 30 лет назад, когда жесткие диски стоили дорого, вращались со скоростью
3600 оборотов в минуту и позволяли записывать мегабайты (!) данных.
В 1987 году типичный жесткий диск был размером 21 Мбайт. В 1997 году от-
личным считался размер 1-2 Гбайт. Сегодня типичный SATA-диск— это
1 Тбайт. У каждого уровня RAID есть ограничения на количество накопителей,
которые можно объединить в массив. Для классического варианта RAID 1 —
всего два диска. Это означает, что та коробочка в офисе уже не масштабируется,
из нее выжато все. Максимум, что можно сделать, — это заменить оба жестких
диска более емкими (вместо дисков в 1 Тбайт установить диски по 2 Тбайт). Для
RAID 5 максимум составляет 16 дисков. Конечно, есть современные уровни
вроде RAID 50 и RAID 51, позволяющие установить 60 дисков. А теперь счита-
ем: пусть у нас есть массив RAID 50, в который мы можем установить 60 дисков
по 1 Тбайт. Учитывая полезное использование емкости дисков в 67% для этого
уровня, полезный объем (который можно использовать для хранения данных)
составит 40 Тбайт. Дорого и нерационально;
□
время восстановления после сбоя
— представим, что у нас есть массив уровня
RAID 1, состоящий из двух дисков. Если один из дисков выйдет из строя, то
RAID-массив продолжит работу в аварийном режиме, ожидая замены сломав-
шегося диска. В это время массив уязвим, поскольку содержит одну копию дан-
ных. Как вычислить время восстановления? Это время, за которое контроллер
запишет данные с рабочего диска на новый. В среднем — это 100 Мбайт/с, если
контроллер не нагружен. Если массив хранит 1 Тбайт данных, то время восста-
новления составит 10 тыс. секунд или 2,7 часа. И это не учитывая времени, по-
траченного на физическую замену диска, которое может оказаться гораздо
больше, чем время копирования. Например, в наличии может не оказаться нуж-
ного диска, и за ним придется куда-то поехать. А по современным меркам даже
2 часа — это много.
Do'stlaringiz bilan baham: |