Лекция Данные. Подходы и определения данных


Распределённые файловые системы



Download 1,54 Mb.
Pdf ko'rish
bet11/22
Sana23.06.2022
Hajmi1,54 Mb.
#693898
TuriЛекция
1   ...   7   8   9   10   11   12   13   14   ...   22
Bog'liq
1-6

Распределённые файловые системы 
Для хранения и обработки Больших данных созданы распределенные 
системы хранения данных, в том числе 
распределённые файловые системы

позволяющие использовать внешнее файловое пространство системы 
хранения для обработки данных на нодах (узлах), входящих в вычислительный 
кластер.


Зачастую удобно использовать распределённые файловые системы, 
арендуемые как отдельный облачный сервис, например, Google Colossus, 
Amazon S3, Yandex Disk.
Распределённые фреймворки 
Обработка находящихся на распределённых системах хранения данных 
ведется параллельно на компьютерах, составляющих 
узлы
(nodes) 
вычислительного кластера
. Для организации вычислений разработчики 
систем обработки используют 
распределённые фреймворки
. Большинство 
фреймворков доступны по лицензии Apache и ориентированы на работу в 
кластерах на базе Linux. Существуют также облачные фреймворки
арендуемые как отдельный облачный сервис.
Бенчмаркинг 
Этот класс инструментов был разработан для оптимизации инсталляции 
Больших данных при помощи использования стандартизированных профилей 
(Profiling suites). 
Бенчмаркинг
и оптимизация инфраструктуры Больших 
данных зачастую не является сферой ответственности дата-ученых (Data 
Scientist), это область ответственности для отдельных профессионалов, 
специализирующихся 
на 
IT-инфраструктуре. 
Использование 
оптимизированной инфраструктуры может существенно снизить стоимость 
используемого оборудования. 
Серверное программирование 
Предположим, что вы сделали приложение для прогнозирования 
результатов футбольных матчей мирового класса на платформе Hadoop, и вы 
хотите разрешить другим использовать прогнозы, сделанные вашим 
приложением. Тем не менее, вы не имеете представления об архитектуре или 
технологии всех, кто стремится использовать ваши прогнозы. Сервисные 
инструменты позволяют предоставлять приложения на Больших данных 
другим приложениям в качестве службы. Наиболее известным примером здесь 
является 
REST
-сервис; REST означает репрезентативную передачу состояния 
(Representational State Transfer, REST). Она часто используется в качестве 
обмена данными с веб-сайтами.
Планирование 
Инструменты 
планирования 
позволяют 
автоматизировать 
повторяющиеся задачи и запускать задания на основе таких событий, как 
добавление нового файла в папку. Они похожи на такие инструменты, как 
CRON в Linux, но специально разработаны для работы в отказоустойчивом 


кластере. Вы можете использовать их, например, для запуска задачи 
MapReduce всякий раз, когда в каталоге имеется новый набора данных.

Download 1,54 Mb.

Do'stlaringiz bilan baham:
1   ...   7   8   9   10   11   12   13   14   ...   22




Ma'lumotlar bazasi mualliflik huquqi bilan himoyalangan ©hozir.org 2024
ma'muriyatiga murojaat qiling

kiriting | ro'yxatdan o'tish
    Bosh sahifa
юртда тантана
Боғда битган
Бугун юртда
Эшитганлар жилманглар
Эшитмадим деманглар
битган бодомлар
Yangiariq tumani
qitish marakazi
Raqamli texnologiyalar
ilishida muhokamadan
tasdiqqa tavsiya
tavsiya etilgan
iqtisodiyot kafedrasi
steiermarkischen landesregierung
asarlaringizni yuboring
o'zingizning asarlaringizni
Iltimos faqat
faqat o'zingizning
steierm rkischen
landesregierung fachabteilung
rkischen landesregierung
hamshira loyihasi
loyihasi mavsum
faolyatining oqibatlari
asosiy adabiyotlar
fakulteti ahborot
ahborot havfsizligi
havfsizligi kafedrasi
fanidan bo’yicha
fakulteti iqtisodiyot
boshqaruv fakulteti
chiqarishda boshqaruv
ishlab chiqarishda
iqtisodiyot fakultet
multiservis tarmoqlari
fanidan asosiy
Uzbek fanidan
mavzulari potok
asosidagi multiservis
'aliyyil a'ziym
billahil 'aliyyil
illaa billahil
quvvata illaa
falah' deganida
Kompyuter savodxonligi
bo’yicha mustaqil
'alal falah'
Hayya 'alal
'alas soloh
Hayya 'alas
mavsum boyicha


yuklab olish