Handling Missing Values in Data Mining Submitted By


 Discovering the Disguise



Download 304,86 Kb.
Pdf ko'rish
bet8/12
Sana26.08.2021
Hajmi304,86 Kb.
#156732
1   ...   4   5   6   7   8   9   10   11   12
Bog'liq
Article by missing data

4.2 Discovering the Disguise       

Assuming  the  presence  of  disguised  missing  data  in  the  datasets  the  most  important  question 

comes in one’s mind is how to detect them. If the data is adequately disguised in the dataset then 

sometimes even domain knowledge or best of the  methods known cannot detect them. But the 

approach  is  to  identify  abnormal  values  or  patterns  in  the  datasets  with  the  help  of  domain 

knowledge or other methods and try to distinguish real from disguised data.  The basic step is to 

identify  suspicious  values  in the datasets which  may  look  factual  but are actually  fake or  false 

data. With the background knowledge a preliminary analysis of data can be done thus coming up 

with  the  range  of  values  for  each  attribute.  Domain  knowledge  might  also  prove  useful  in  the 

above process. Once we have the range of attributes we can examine the data to find suspicious 

values and thus detect disguised values. Alternatively partial domain knowledge can also prove 

useful in exposing disguised missing data. For example, even if we do not have any knowledge 

of  lower  or  upper  bounds  of  data  we  can  still  come  to  a  conclusion  for  variables  like  age  that 

they  can  never  be  negative.  Detecting  outliers  can  sometimes  help  in  uncovering  disguised 

missing  data  but  not  always.  If  the  values  selected  to  encode  missing  data  are  sufficiently  far 

outside the range of the nominal data to appear as outliners, we can apply standard techniques to 

look for disguised missing data [3].     

 



Data Cleaning and Preparation 

Term Paper 

Submitted by: Bhavik Doshi 

 

Page | 8  



 

 


Download 304,86 Kb.

Do'stlaringiz bilan baham:
1   ...   4   5   6   7   8   9   10   11   12




Ma'lumotlar bazasi mualliflik huquqi bilan himoyalangan ©hozir.org 2025
ma'muriyatiga murojaat qiling

kiriting | ro'yxatdan o'tish
    Bosh sahifa
юртда тантана
Боғда битган
Бугун юртда
Эшитганлар жилманглар
Эшитмадим деманглар
битган бодомлар
Yangiariq tumani
qitish marakazi
Raqamli texnologiyalar
ilishida muhokamadan
tasdiqqa tavsiya
tavsiya etilgan
iqtisodiyot kafedrasi
steiermarkischen landesregierung
asarlaringizni yuboring
o'zingizning asarlaringizni
Iltimos faqat
faqat o'zingizning
steierm rkischen
landesregierung fachabteilung
rkischen landesregierung
hamshira loyihasi
loyihasi mavsum
faolyatining oqibatlari
asosiy adabiyotlar
fakulteti ahborot
ahborot havfsizligi
havfsizligi kafedrasi
fanidan bo’yicha
fakulteti iqtisodiyot
boshqaruv fakulteti
chiqarishda boshqaruv
ishlab chiqarishda
iqtisodiyot fakultet
multiservis tarmoqlari
fanidan asosiy
Uzbek fanidan
mavzulari potok
asosidagi multiservis
'aliyyil a'ziym
billahil 'aliyyil
illaa billahil
quvvata illaa
falah' deganida
Kompyuter savodxonligi
bo’yicha mustaqil
'alal falah'
Hayya 'alal
'alas soloh
Hayya 'alas
mavsum boyicha


yuklab olish