Handling Missing Values in Data Mining Submitted By


 Approaches to clean disguised missing data



Download 304,86 Kb.
Pdf ko'rish
bet9/12
Sana26.08.2021
Hajmi304,86 Kb.
#156732
1   ...   4   5   6   7   8   9   10   11   12
Bog'liq
Article by missing data

4.3 Approaches to clean disguised missing data

One approach to clean such data is to have some domain knowledge. A domain expert can screen 



entries  with  suspicious  values,  such  as  blood  pressure  of  a  patient  being  0  [4].  Considering 

outliers  as  disguised  missing  data  is  another  way  but  might  not  be  feasible  if  the  volume  of 

disguised missing data is large. Again having some domain knowledge may help in  identifying 

disguised  missing data. For example,  if the  number of  males exceeds the number of  females  in 

the dataset and we know that the population of males and females is nearly equal in the dataset, 

then  we  can  come  to  the  conclusion  that  some  male  values  in  the  dataset  may  be  disguised 

missing [4].   The above described  methods heavily depend on domain knowledge which  is  not 

always  available.  Or  sometimes  if  missing  values  disguise  themselves  as  inliers  then  domain 

knowledge may also not be useful in detecting them [3]. The authors in [4] propose a framework 

for  identifying  suspicious  frequently  used  disguised  values.  Additionally  the  paper  defines  an 

Embedded  Unbiased  Sample  Heuristic  approach  to  discover  missing  values.  The  framework  is 

divided into two phases, namely the mining phase and the post processing phase. In the mining 

phase  each  attribute  is  analyzed  and  checked  based  on  the  heuristic  approach.  The  first  phase 

outputs some probable disguised missing values which can be confirmed in the post processing 

phase  with  the  help  of  domain  knowledge  or  other  data  cleaning  methods.  Thus  identifying 

disguised missing data and then eliminating for the dataset constitute a very important step in the 

process of data cleaning and preparation. 

 

 



 


Data Cleaning and Preparation 

Term Paper 

Submitted by: Bhavik Doshi 

 

Page | 9  



 

 


Download 304,86 Kb.

Do'stlaringiz bilan baham:
1   ...   4   5   6   7   8   9   10   11   12




Ma'lumotlar bazasi mualliflik huquqi bilan himoyalangan ©hozir.org 2024
ma'muriyatiga murojaat qiling

kiriting | ro'yxatdan o'tish
    Bosh sahifa
юртда тантана
Боғда битган
Бугун юртда
Эшитганлар жилманглар
Эшитмадим деманглар
битган бодомлар
Yangiariq tumani
qitish marakazi
Raqamli texnologiyalar
ilishida muhokamadan
tasdiqqa tavsiya
tavsiya etilgan
iqtisodiyot kafedrasi
steiermarkischen landesregierung
asarlaringizni yuboring
o'zingizning asarlaringizni
Iltimos faqat
faqat o'zingizning
steierm rkischen
landesregierung fachabteilung
rkischen landesregierung
hamshira loyihasi
loyihasi mavsum
faolyatining oqibatlari
asosiy adabiyotlar
fakulteti ahborot
ahborot havfsizligi
havfsizligi kafedrasi
fanidan bo’yicha
fakulteti iqtisodiyot
boshqaruv fakulteti
chiqarishda boshqaruv
ishlab chiqarishda
iqtisodiyot fakultet
multiservis tarmoqlari
fanidan asosiy
Uzbek fanidan
mavzulari potok
asosidagi multiservis
'aliyyil a'ziym
billahil 'aliyyil
illaa billahil
quvvata illaa
falah' deganida
Kompyuter savodxonligi
bo’yicha mustaqil
'alal falah'
Hayya 'alal
'alas soloh
Hayya 'alas
mavsum boyicha


yuklab olish