Axborot texnologiyalari, tarmoqlar va telekommunikatsiyalar


ИСПОЛЬЗОВАНИЕ PYTHON ПРИ РАБОТЕ С БОЛЬШИМИ



Download 5,02 Mb.
Pdf ko'rish
bet93/222
Sana15.11.2022
Hajmi5,02 Mb.
#866857
1   ...   89   90   91   92   93   94   95   96   ...   222
ИСПОЛЬЗОВАНИЕ PYTHON ПРИ РАБОТЕ С БОЛЬШИМИ 
ДАННЫМИ 
Ибрагимов Баходир Бахромбек угли 
Новосибирский Государственный Университет, студент магистратуры, 
b.ibragimov@g.nsu.ru 
Научный руководитель: 
д.т.н. Барахнин Владимир Борисович 
Новосибирский государственный университет 
Аннотация 
Большие данные, неумолимо внедряются практически во все сферы 
жизни и пользователь повседневно сталкивается с необходимостью 
длительного анализа получаемой информации. Поэтому в последнее время 
активно развиваются способы упрощения возможностей добычи и анализа 
данных: RapidMiner, язык программирования R, методы Data Mining. Однако 
все вышеперечисленные способы довольно сложны для обычного 
пользователя. Автором данной статьи предлагается использовать небольшие 
парсеры для упрощения работы пользователя и обработки объемных сайтов с 
данными. 
Ключевые слова:
большие данные, Data Moning, парсинг, python 
разработка, анализ данных, машинное обучение. 
Введение 
Big Data, или «большие данные» по-русски - термин, появившийся совсем 
недавно - всего шесть лет назад. Но это не означает, что одновременно 
возникло и само явление. Большими данными принято называть большие 
объемы информации со сложной неоднородной и / или неопределенной 
структурой. Иногда о больших данных говорят как о неструктурированной 
информации, но это неверно - большие данные всегда имеют структуру, они 
могут быть сложными из-за того, что данные поступают из разных 
источников и содержат совершенно разную информацию или совершенно 
неизвестны. То есть, как правило, собрать эту стопку в одну таблицу не 
удается. Большие данные (Big Data) - это структурированные и 
неструктурированные данные огромных объемов и разнообразия, а также 


International scientific conference "INFORMATION TECHNOLOGIES, NETWORKS AND 
TELECOMMUNICATIONS" ITN&T-2022 Urgench, 2022y April 29-30 
463 
методы их обработки, которые позволяют распределенно анализировать 
информацию. 

Download 5,02 Mb.

Do'stlaringiz bilan baham:
1   ...   89   90   91   92   93   94   95   96   ...   222




Ma'lumotlar bazasi mualliflik huquqi bilan himoyalangan ©hozir.org 2024
ma'muriyatiga murojaat qiling

kiriting | ro'yxatdan o'tish
    Bosh sahifa
юртда тантана
Боғда битган
Бугун юртда
Эшитганлар жилманглар
Эшитмадим деманглар
битган бодомлар
Yangiariq tumani
qitish marakazi
Raqamli texnologiyalar
ilishida muhokamadan
tasdiqqa tavsiya
tavsiya etilgan
iqtisodiyot kafedrasi
steiermarkischen landesregierung
asarlaringizni yuboring
o'zingizning asarlaringizni
Iltimos faqat
faqat o'zingizning
steierm rkischen
landesregierung fachabteilung
rkischen landesregierung
hamshira loyihasi
loyihasi mavsum
faolyatining oqibatlari
asosiy adabiyotlar
fakulteti ahborot
ahborot havfsizligi
havfsizligi kafedrasi
fanidan bo’yicha
fakulteti iqtisodiyot
boshqaruv fakulteti
chiqarishda boshqaruv
ishlab chiqarishda
iqtisodiyot fakultet
multiservis tarmoqlari
fanidan asosiy
Uzbek fanidan
mavzulari potok
asosidagi multiservis
'aliyyil a'ziym
billahil 'aliyyil
illaa billahil
quvvata illaa
falah' deganida
Kompyuter savodxonligi
bo’yicha mustaqil
'alal falah'
Hayya 'alal
'alas soloh
Hayya 'alas
mavsum boyicha


yuklab olish