Руководство по принятию правильных решений в мире недостающих данных «Темные данные: Практическое руководство по принятию правильных решений в мире недостающих данных»



Download 1,71 Mb.
Pdf ko'rish
bet49/84
Sana04.11.2022
Hajmi1,71 Mb.
#860117
TuriРуководство
1   ...   45   46   47   48   49   50   51   52   ...   84
Bog'liq
Тёмные данные. 2021

Приукрашивание 
Приукрашивание — корректировка данных с целью их лучшего соответствия теории. 
Бэббидж охарактеризовал этот процесс как «отрезание маленьких кусочков тут и там от 
наблюдений, которые слишком далеко отстоят от средних значений, и приклеивание их к 
тем, которые находятся слишком близко». При этом стратегическое среднее значение может 
быть оставлено без изменений, а диапазон значений сужен, что заставит неопределенность 
измерений казаться меньше, чем она есть на самом деле. 
В статистике существуют надежные методы, которые делают нечто подобное и при 
определенных обстоятельствах защищают от избыточного влияния, которое необычно 
высокие или низкие (а значит, возможно, ложные) значения могут оказать на результаты. 
Один из таких методов, винсоризация (в честь статистика Чарльза Уинсора), заключается в 
замене экстремальных значений другими, находящимися на определенном удалении от 
среднего. Например, значения, лежащие за пределами двух стандартных отклонений, могут 
считаться недостоверными и заменяться значениями на уровне двух стандартных 
отклонений. Среднее значение полученных в результате данных будет менее изменчиво, чем 
среднее значение исходных данных, поэтому ваша аудитория должна обязательно знать, что 
данные были изменены. Если вы не сообщите об этом, то замаскируете правду. И обратите 


112 
внимание, что этот технический прием не подразумевает приклеивания обрезанных 
«кусочков» данных к другим значениям! 
В предельной версии приукрашивания фрагменты данных перемещаются или копируются 
целыми партиями из одной части большого набора данных в другую. Как и при банальном 
выдумывании данных, такие «оптовые поставки» могут сэкономить массу усилий! Я видел, 
как это делалось с числовыми данными в случаях предполагаемого мошенничества, которые 
мне довелось изучать, но все-таки чаще такой подход используют при работе с 
фотографиями, когда хотят, чтобы на них отображалось нечто иное. 
Я также неоднократно видел, как серьезным приукрашиванием занимаются и на более 
высоком уровне. Работы, представленные в авторитетные научные журналы, проходят 
процедуру рецензирования, в ходе которой они рассылаются нескольким независимым 
исследователям для оценки точности представленных результатов, правильности проведения 
исследования и важности его публикации. Если рецензент указывает на какие-то недостатки 
в исследовании, то авторы в ответ порой вносят в статью поправки, добавляющие 
двусмысленности, чтобы другие рецензенты (да и читатели) не смогли обнаружить ошибок, 
после чего отправляют статью в другой журнал. 
Например, достоверность статистического теста или процедуры моделирования может 
основываться на допущениях, которые при проверке данных оказываются сомнительными, 
что делает потенциально недействительными и сами выводы. Однажды в качестве 
рецензента я наткнулся на статью, в которой приводились средние и медианные значения 
выборки данных. Их соотношение вызвало у меня подозрение, что распределение было 
искажено, а это уже делало недействительным статистический анализ, приводимый далее в 
исследовании. Когда я выразил свои сомнения в отчете, то вместо того, чтобы провести 
повторный анализ, который мог бы исправить эту ситуацию (или, возможно, изменить 
выводы), авторы просто удалили упоминание о медиане, прежде чем представить статью в 
другой журнал. К их большому огорчению, редакторы второго журнала отправили статью 
тому же рецензенту! 

Download 1,71 Mb.

Do'stlaringiz bilan baham:
1   ...   45   46   47   48   49   50   51   52   ...   84




Ma'lumotlar bazasi mualliflik huquqi bilan himoyalangan ©hozir.org 2025
ma'muriyatiga murojaat qiling

kiriting | ro'yxatdan o'tish
    Bosh sahifa
юртда тантана
Боғда битган
Бугун юртда
Эшитганлар жилманглар
Эшитмадим деманглар
битган бодомлар
Yangiariq tumani
qitish marakazi
Raqamli texnologiyalar
ilishida muhokamadan
tasdiqqa tavsiya
tavsiya etilgan
iqtisodiyot kafedrasi
steiermarkischen landesregierung
asarlaringizni yuboring
o'zingizning asarlaringizni
Iltimos faqat
faqat o'zingizning
steierm rkischen
landesregierung fachabteilung
rkischen landesregierung
hamshira loyihasi
loyihasi mavsum
faolyatining oqibatlari
asosiy adabiyotlar
fakulteti ahborot
ahborot havfsizligi
havfsizligi kafedrasi
fanidan bo’yicha
fakulteti iqtisodiyot
boshqaruv fakulteti
chiqarishda boshqaruv
ishlab chiqarishda
iqtisodiyot fakultet
multiservis tarmoqlari
fanidan asosiy
Uzbek fanidan
mavzulari potok
asosidagi multiservis
'aliyyil a'ziym
billahil 'aliyyil
illaa billahil
quvvata illaa
falah' deganida
Kompyuter savodxonligi
bo’yicha mustaqil
'alal falah'
Hayya 'alal
'alas soloh
Hayya 'alas
mavsum boyicha


yuklab olish