Katta ma'lumotlarni qayta ishlash uchun mashinani o'rganish bo'yicha so'rov
Kalit so'zlar: Mashinani o'rganish; katta ma'lumotlar; qayta ishlash; algoritmlar
1.Kirish
Bugungi dunyo ma'lumotlarga asoslangan dunyo bo'lib, hayotimizning barcha jabhalariga kirib borgan texnologiyalarning tez o'sishi natijasida ma'lumotlar katta hajmda ishlab chiqarilmoqda. Turli shakllarda ishlab chiqarilgan ma'lumotlarning doimiy hajmidan ma'noli tushunchaga ega bo'lish uchun ma'lumotlarni qayta ishlashning yangi usullari ishlab chiqilishi va takomillashtirilishi kerak. Mashinani o'rganish texnologiyalari katta hajmdagi ma'lumotlarni qayta ishlash va undan qiymat olish uchun istiqbolli echimlar va potentsial usullarni taqdim etadi. Ushbu tadqiqot katta ma'lumotlarni qayta ishlashda mashinani o'rganish usullarini qo'llash bo'yicha adabiyotlarni ko'rib chiqadi. U mashinani o'rganish algoritmlari va usullarining umumiy ko'rinishini, katta ma'lumotlarga qisqacha kirishni va katta hajmdagi ma'lumotlarni qayta ishlash uchun turli sohalarda mashinani o'rganish usullarini qo'llagan tegishli ishlar muhokamasini taqdim etadi. Tadqiqot shuningdek, katta ma'lumotlar uchun mashinani o'rganishdan foydalanish bilan bog'liq muammolar va muammolarni muhokama qiladi.
So'nggi bir necha yil ichida ma'lumotlar hajmi misli ko'rilmagan sur'atda oshmaguncha, katta ma'lumotlarga olib keladigan "veb-texnologiyalar, ijtimoiy media va mobil qurilmalar" kengayguncha ma'lumotlar eksponent tarzda o'sishni boshladi. Masalan, Twitter kuniga 70 million tvitni qayta ishlagan va kuniga 8 TB dan ortiq tvit ishlab chiqargan [ 1 ].
Ijtimoiy tarmoq saytlari, mehmonxona ma'lumotlari, ob-havo ma'lumotlari, onlayn-do'konlar, bank ishi va katta ma'lumotlarning boshqa manbalari bir nechta misoldir [ 2 ]. Biroq, agar u to'liq va chuqur tekshirilmasa, foydasizdir. Big Data Analytics — bir qator korporativ ilovalarga qoʻllanilishi yoki umuman odamlar hayotini yaxshilash uchun foydali tushunchalarni olish maqsadida katta maʼlumotlar toʻplamini tahlil qilish usulidir [2 ] .
Biz ilgari ko'rilmagan va eshitilmagan turli manbalardan aql bovar qilmaydigan miqdordagi ma'lumotlar yaratilayotgan davrda yashayapmiz. Ushbu kutilmagan ma'lumotlarni yig'ish, qayta ishlash va baholash uchun texnologiya ishlab chiqilgan bo'lsa ham, ko'plab muammolar va tashvishlar saqlanib qolmoqda. Katta ma'lumotni yaxshiroq tushunish va qimmatli tushunchalarga ega bo'lish uchun ko'plab tadqiqotlar olib borilmoqda. Endi biz tadqiqotning har bir sohasida, jumladan asosiy fanlar, amaliy fanlar, muhandislik, ijtimoiy fanlar, biotibbiyot fanlari va hokazolarda katta ma'lumotlar bilan shug'ullanamiz. Ushbu sektorlarning barchasi katta ma'lumotlar to'plamlari bilan shug'ullanadi va juda ko'p kuch sarflanadi
Bu asar Creative Commons Attribution 4.0 xalqaro litsenziyasi boʻyicha litsenziyalangan boʻlib, asl asardan toʻgʻri iqtibos keltirilsa, har qanday vositada cheksiz foydalanish, tarqatish va koʻpaytirishga ruxsat beradi.
Zamonaviy ma'lumotlar qiyinchiliklarini hal qilishda ko'p va'dalarga ega bo'lgan Machine Learning (ML) kabi domenlardan foydalangan holda Big Datadan yaxshiroq foydalanish va tahlil qilish uchun qilingan [ 3 ].
Mashinani o'rganish usullari so'nggi o'n yillikda tibbiyot, astronomiya, biologiya va boshqalar kabi turli xil keng va murakkab ma'lumotlarni talab qiluvchi sohalarda tobora ommalashib bormoqda, chunki ular ma'lumotlarning yashirin ma'lumotlarini qazib olish uchun potentsial javoblarni taqdim etadi [4 ] .
Ushbu maqola quyidagicha tuzilgan: 2-bo'limda mashinani o'rganish va uning texnikasi haqida umumiy ma'lumot berilgan. 3-bo'limda katta ma'lumotlar tushunchalari va ilovalari keltirilgan. 4-bo'lim tegishli ish haqida qisqacha ma'lumot beradi. 5-bo'limda katta ma'lumotlarni qayta ishlash bilan bog'liq mashinani o'rganish masalalari muhokama qilinadi. Nihoyat, 6-bo'limda ba'zi xulosalar keltirilgan.
Do'stlaringiz bilan baham: |