Manbalar:
Matematika maktab kursi video darslari: https://www.youtube.com/c/Matematikadarslari
Khan Akademiyasining o'zbek tilidagi darslari: https://uz.khanacademy.org/
"EHTIMOLLAR NAZARIYASI VA MATEMATIK STATISTIKA" kitobi (pdf yuklab olish).
Maʼlumotlar tuzilmasi va algoritmlar onlayn kursi: https://mohirdev.uz/courses/algoritmlar/
Albatta soha mutaxassisi sifatida bevosita Data Science uchun qulay dasturlash tillaridan birini oʻzlashtirish talab qilinadi. Bugungi kunda sizning oldingizda ikki tanlov bor:
R: Bevosita maʼlumotlar bilan ishlash, turli matematik va statistik hisob-kitob va tahlil uchun ishlatiladi. Agar siz matematikada kuchli boʻlsangiz va bevosita maʻlumotlar tahlili bilan shugʻullanishni istasangiz, sizning tanlovingiz R dasturlash tili.
Python: Yuqori darajadagi, umumiy maqsadli dasturlash tili. Python oddiy dasturlardan tortib, murakkab hisob-kitoblar va tizimlar yaratish uchun ham ishlatiladi.
Agar sizning maqsadingiz matematik hisob-kitoblardan o'tib, sunʼiy intellekt asosida ishlaydigan dasturlar yaratish boʻlsa, Pythondan afzalroq tilni topa olmaysiz. Python oʻrganish uchun oson, dasturlash uchun qulay va muhimi Data Sciencga oid tayyor funksiyalar, kutubxonalar va frameworklarga boy tildir.
Bugungi kunda Google, Facebook, Tesla, IBM, Amazon kabi kompaniyalar ham oʻz sunʼiy intellekt dasturlarini yaratishda Pythondan foydalanib kelishadi.
Vaqt: 1-3 oydan koʻp vaqt ketkazmang.
Manba:
Pythonda dasturlash asoslari: https://python.sariq.dev
Maʼlumotlar bilan ishlash uchun oʻz-oʻzidan maʼlumotlarni biror joyda saqlash, kerak vaqtda unga murojaat qilish, maʼlumotlar orasidan oʻzimizga kerak qismini filtrlab, ajratib olishni ham bilishimiz kerak.
Bugungi kunda SQL (va unga oʻxshash) maʼlumotlar omboridan foydalanish maʼlumotlarni saqlashning eng ommabop usuli hisoblanadi. Demak siz ham SQL maʼlumotlar ombori bilan ishlashni minimal darajada bilishingiz kerak boʻladi. Jumladan, omborga murojaat qilish, undagi maʼlumotlarni maʼlum parametr yoki filtr asosida chaqirib olish, maʼlumotlarni tartiblash, ularni qaytarib omborga yuklash va hokazo.
Vaqt: Bu qadamda juda koʻp vaqt sarflamang, yuqorida aytilgan minimal bilimlarni oʻzlashtirishga 2–3 haftadan koʻp vaqt ketmasligi kerak.
Manbalar: Har qanday dasturchi bilishi shart boʻlgan bilimlardan biri — bu versiya nazorati. Data Science loyiha ustida ishlar ekansiz kodingiz doimiy ravishda yangilanib turadi. Loyiha davomida ishlatilayotgan maʼlumotlar ham, ularga ishlov berish uchun foydalanilgan funksiyalar ham vaqt oʻtishi bilan takomillashishi yoki aksincha "bug"larga duch kelishi mumkin. Shunday xolatlarda loyihangizning har bir qadamini, har bir oʻzgarishini saqlab olish borish va kerak vaqtda eskiroq versiyaga qaytish, yoki loyihani tarmoqlab, yangi yoʻnalishda ketish uchun maxsus versiya nazorati tizimlari ishingizni ming karra yengillashtiradi.
Qolaversa bunday tizimlar yordamida loyihangizni doimiy ravishda bulutga saqlab borishingiz va kerak vaqtda istalgan joydan murojaat qilib davom ettirib ketishingiz yoki hamkasblar va mijozlar bilan ulashishingiz mumkin.
Bugungi kunda eng mashxur versiya nazorati tizimi Git va u bilan ishlaydigan GitHub sahifasi.
Vaqt: Uzogʻi 1 hafta
Manbalar:
Farkhod Dadajonovning video darslari:https://youtube.com/playlist?list=PL_WK6W0Gn1I5GcICgBTsq4pW2rKV9cK-F
Saidbek Arislonov. Git va Github: https://www.youtube.com/watch?v=JtVnOZ26XHA
Farkhod Dadajonovdan SQL darslari: https://youtube.com/playlist?list=PL1538BF8E4A3E5D56
SQLga oid qoʻllanmalar: https://www.tutorials.uz/tutorial/mysql
Maʼlumotlar muhandisligi juda katta soha va albatta sohaga qadam qoʻyishdan avval bevosita maʼlumotlarni yigʻish va ularga ishlov berishni oʻrganish zarur.
Maʼlumotlar matn, jadval, rasm, audio/video, arxiv qogʻozlari va boshqa koʻrinishda boʻlishi mumkin. Sizning birlamchi vazifangiz esa bu maʼlumotlarga ishlov berishdan avval ularni bir koʻrinishga keltirish, boʻshliqlarni toʻldirish, xato maʼlumotlarni oʻchirish va hokazolardan iborat boʻladi.
Buning uchun oz bo'lsada turli maʼlumot turlari bilan ishlaydigan dasturlarini bilishingiz kerak. Masalan, jadvallar bilan ishlash uchun Excel, pdf yoki rasm koʻrinishidagi hujjatlarni matn koʻrinishiga keltiruvchi dasturlar va hokazo.
Maʼlumotlarga bevosita Pythonda ishlov berish uchun esa pandas kutubxonasi bilan yaqindan tanishib chiqishni tavsiya qilaman.
Shuningdek bu qadamning muhim qismlaridan biri turli manbaalarga murojaat qilish orqali loyihangiz uchun kerakli maʼlumotlar toʻplamini topish yoki jamlash.
Odatda bunday toʻplamlar datasets deb ataladi va onlaynda turli mavzulardagi datasetlar yigʻilgan saytlar talaygina.
Do'stlaringiz bilan baham: |