Лекция Данные. Подходы и определения данных



Download 1,54 Mb.
Pdf ko'rish
bet14/22
Sana23.06.2022
Hajmi1,54 Mb.
#693898
TuriЛекция
1   ...   10   11   12   13   14   15   16   17   ...   22
Bog'liq
1-6

Контрольные вопросы: 
1. Что такое Большие данные? 
2. Какие пять характеристик присущи Большим данным? 
3. Какие существуют базовые принципы обработки Больших данных? 
4. Что такое столбцовые базы данных?
5. Что такое потоковые данные? 
6. Что такое хранилища документов? 
7. Что такое SQL на Hadoop? 
8. Что такое новый SQL? 
9. Что такое графовые базы данных? 
10. Что такое хранилище для ключей? 


Лекция 4. Архитектура системы обработки Больших данных 
Для работы с Большими данными используются сложные системы, в 
которых можно выделить несколько 
компонентов
или 
слоёв
(Layers). Обычно 
выделяют четыре уровня компонентов таких систем: 
прием

сбор

анализ 
данных
и 
представление результатов
(рис. 1). Это деление является в 
значительной мере условным так как, с одной стороны, каждый компонент в 
свою очередь может быть разделен на подкомпоненты, а с другой некоторые 
функции компонентов могут перераспределяться в зависимости от решаемой 
задачи и используемого программного обеспечения, например, выделяют 
хранение данных в отдельный слой. 
Рисунок 1 – Стек работы с Большими данными 
Для работы с Большими данными разработчиками систем создаются 
модели данных, содержательно связанные с реальным миром. Разработка 
адекватных моделей данных представляет собой сложную аналитическую 
задачу, выполняемую системными архитекторами и аналитиками. Модель 
данных позволяет создать математическую модель взаимодействий объектов 
реального мира и включает в себя описание структуры данных. Описание 
разработки моделей данных не является задачей настоящего руководства.
Для хранения данных используются распределенные системы 
различных типов. Это могут быть файловые системы, базы данных, журналы, 
механизмы доступа к общей виртуальной памяти. Большинство систем 
хранения ориентированы исключительно на работу с Большими данными, они 
имеют крайне ограниченное число функций (например, может отсутствовать 
возможность не только модификации, но и удаления поступивших данных) 


что объясняется внутренней сложностью создания высокоэффективных 
распределенных систем.
Для того, чтобы работа с данными происходила быстрее системы 
хранения и обработки данных распараллеливаются в кластере (cluster, группа 
компьютеров, объединенных сетью для выполнения единой задачи). Однако, 
согласно гипотезе Брюера невозможно обеспечить одновременную 
согласованность (непротиворечивость) данных, доступность данных и 
устойчивость системы к отделению отдельных узлов. Гипотеза доказана для 
транзакций типа ACID (Atomic, Consistent, Isolated, Durable) и известна под 
названием CAP (Consistency, Availability, Partition tolerance) теоремы. 

Download 1,54 Mb.

Do'stlaringiz bilan baham:
1   ...   10   11   12   13   14   15   16   17   ...   22




Ma'lumotlar bazasi mualliflik huquqi bilan himoyalangan ©hozir.org 2024
ma'muriyatiga murojaat qiling

kiriting | ro'yxatdan o'tish
    Bosh sahifa
юртда тантана
Боғда битган
Бугун юртда
Эшитганлар жилманглар
Эшитмадим деманглар
битган бодомлар
Yangiariq tumani
qitish marakazi
Raqamli texnologiyalar
ilishida muhokamadan
tasdiqqa tavsiya
tavsiya etilgan
iqtisodiyot kafedrasi
steiermarkischen landesregierung
asarlaringizni yuboring
o'zingizning asarlaringizni
Iltimos faqat
faqat o'zingizning
steierm rkischen
landesregierung fachabteilung
rkischen landesregierung
hamshira loyihasi
loyihasi mavsum
faolyatining oqibatlari
asosiy adabiyotlar
fakulteti ahborot
ahborot havfsizligi
havfsizligi kafedrasi
fanidan bo’yicha
fakulteti iqtisodiyot
boshqaruv fakulteti
chiqarishda boshqaruv
ishlab chiqarishda
iqtisodiyot fakultet
multiservis tarmoqlari
fanidan asosiy
Uzbek fanidan
mavzulari potok
asosidagi multiservis
'aliyyil a'ziym
billahil 'aliyyil
illaa billahil
quvvata illaa
falah' deganida
Kompyuter savodxonligi
bo’yicha mustaqil
'alal falah'
Hayya 'alal
'alas soloh
Hayya 'alas
mavsum boyicha


yuklab olish