Руководство по принятию правильных решений в мире недостающих данных «Темные данные: Практическое руководство по принятию правильных решений в мире недостающих данных»


Источник и его достоверность: кто вам такое сказал?



Download 1,71 Mb.
Pdf ko'rish
bet52/84
Sana04.11.2022
Hajmi1,71 Mb.
#860117
TuriРуководство
1   ...   48   49   50   51   52   53   54   55   ...   84
Bog'liq
Тёмные данные. 2021

Источник и его достоверность: кто вам такое сказал? 
За последние пару лет в новостях появился особый жанр — так называемые фейк-ньюс, 
которые представляют собой темные данные (DD-тип 14: фальшивые и синтетические 


115 
данные). «Википедия» определяет фейк-ньюс как «тип желтой журналистики или 
пропаганды, который состоит из преднамеренной дезинформации или обмана». «Желтая 
журналистика» — термин, придуманный в конце XIX в. во время газетных войн между 
медиамагнатами Уильямом Рэндольфом Херстом и Джозефом Пулитцером, который 
означает публикацию преувеличенных и сенсационных историй. Своим названием этот 
термин обязан «желтому малышу» — комическому персонажу в желтой рубахе, который 
впервые появился в пулитцеровской газете New World. Херст ответил тем, что запустил 
такого же «желтого малыша» гулять по страницам своего издания New York Journal. 
Фейк-ньюс, как правило, оперируют словами, а не цифрами, но тем не менее они могут 
классифицироваться как темные данные — вы думаете, что знаете нечто, но это не так. И в 
той степени, в которой обман совершается умышленно, он является своего рода 
мошенничеством. 
Проблема отделения зерен от плевел, то есть правды от лжи, стояла перед человечеством с 
незапамятных времен. И до сих пор у нее нет однозначного решения. Но в области данных 
существует одна весьма полезная стратегия — вы должны настаивать на том, чтобы вас 
информировали, откуда поступают данные, кто их собирал или кто сообщил о них. Как я 
написал в своей статье на эту тему, когда вы получаете данные со стороны, задайте простой 
вопрос: «Кто вам такое сказал?»39 Всегда настаивайте на том, чтобы вам раскрывали 
происхождение данных. Если вы не получаете ответа на свой вопрос, делайте выводы о 
вероятной достоверности информации (кроме случаев, когда существует риск для источника 
информации). На практике это означает, что все газеты и сайты, все журналисты и политики 
должны указывать, откуда они получили свою информацию. Это позволит в любой момент 
проверить их слова — необязательно делать это, важна сама возможность. Хотя такая 
стратегия не решает всех проблем с достоверностью данных и не сможет помешать 
сознательному отбору информации в поддержку своей позиции, в ряде случаев она будет 
полезна. 
Частичное решение проблем темных данных кроется в понятии «прозрачность» — по 
крайней мере решение таких проблем, которые возникают в результате мошенничества и 
обмана. Идея состоит в том, что скрыть реально происходящее намного сложнее, если 
информация о нем будет опубликована. Люди видят своими глазами, что происходит, и 
мошенничество становится затруднительным. Это свет, который разгоняет мрак, 
окутывающий темные данные. Западные демократии придают большое значение такой 
открытости на разных уровнях государственного управления — даже правительствам 
рекомендуется публиковать подробности своих сделок. Кодекс прозрачности местного 
самоуправления Великобритании гласит: «Прозрачность — это основа подотчетности на 
местном уровне и ключ к получению людьми инструментов и информации, необходимых 
для того, чтобы они могли играть более важную роль в обществе. Доступность данных также 
способна открыть новые рынки для местного бизнеса, волонтеров и общественных 
организаций, социальных предприятий по оказанию услуг и управлению государственными 
активами… Правительство считает, что все данные, находящиеся в распоряжении и под 
управлением местных властей, должны быть доступны для жителей, если они не требуют 
конфиденциальности»40. Далее в документе говорится: «Этот кодекс гарантирует, что 
местные жители отныне могут получать доступ к данным о том… как тратятся деньги 
местных бюджетов… как используются активы… как принимаются решения по вопросам, 
значимым для местного населения». Например, сведения о расходных статьях управы района 
Теймсайд в Большом Манчестере, превышающих £500, каждый квартал становятся 
общедоступными41. Эти сведения включают в себя данные о поставщиках, названия 
отделов, описания товаров или услуг, суммы, даты и пр. 
Однако на уровне персональных данных тенденция развивается в обратном направлении — в 
сторону защиты конфиденциальности или, с точки зрения этой книги, к затемнению 


116 
отдельных данных. В русле этой тенденции 25 мая 2018 г. вступил в силу Общий регламент 
ЕС по защите данных (GDPR), упомянутый в главе 2. Он налагает обязательства на 
организации, которые хранят и используют персональные данные, и дает людям более 
широкие права на свои данные и способы их использования. Персональные данные — это 
данные, относящиеся к живому человеку, по которым он может быть идентифицирован. 
GDPR требует, чтобы организации объясняли, с какой целью они собирают и используют 
данные, и делали это только с однозначного и свободного согласия (или предоставляя 
особые обоснования, такие как судебное требование или спасение чьей-то жизни). Люди 
имеют право доступа к своим данным и право требования их исправления, удаления или 
передачи другому оператору. Стоит также отметить, что такого рода юридические 
требования создают значительные бюрократические препоны для предприятий, которые 
обрабатывают большие объемы персональных данных. 
Обратите внимание, что я использовал слово «прозрачность» в том смысле, в котором оно 
обычно используется, когда люди говорят о прозрачности данных, — то есть обозначая 
возможность доступа. Но сам феномен прозрачности может быть интерпретирован и 
по-другому — как нечто прозрачное, что позволяет видеть сквозь себя и что, возможно, вы 
даже не замечаете. Окна и линзы очков тоже прозрачны. И неприятный факт заключается в 
том, что многие из наиболее эффективных мошенничеств и афер основаны именно на такой 
интерпретации прозрачности, когда все происходит незаметно для вас и выглядит 
достоверно, но ровно до тех пор, пока вы вдруг не замечаете какие-то несоответствия. В этом 
смысле «прозрачность» имеет сходство с «темнотой», во всяком случае в том, что касается 
данных. 
В этой главе мы говорили о том, как распознать проблему темных данных и, возможно, 
решить ее, в частности, в контексте научных исследований. Мы рассмотрели идею 
сопоставления теории с данными, ошибки, допускаемые из-за их недостатка, мошенническое 
использование данных, фальшивые данные, выбор экстремальных значений в наборе, 
проблему направленного поиска аномалий и предположение, что «большинство научных 
открытий ошибочно». Мы также познакомились с принципом проверки достоверности 
источника, заключенном в простом вопросе: «Кто вам такое сказал?» 
Первая часть книги была посвящена способам, которыми темные данные могут создавать 
проблемы. Во второй части мы рассмотрим методы обнаружения темных данных, их учета и 
узнаем то, как они могут быть использованы. 

Download 1,71 Mb.

Do'stlaringiz bilan baham:
1   ...   48   49   50   51   52   53   54   55   ...   84




Ma'lumotlar bazasi mualliflik huquqi bilan himoyalangan ©hozir.org 2024
ma'muriyatiga murojaat qiling

kiriting | ro'yxatdan o'tish
    Bosh sahifa
юртда тантана
Боғда битган
Бугун юртда
Эшитганлар жилманглар
Эшитмадим деманглар
битган бодомлар
Yangiariq tumani
qitish marakazi
Raqamli texnologiyalar
ilishida muhokamadan
tasdiqqa tavsiya
tavsiya etilgan
iqtisodiyot kafedrasi
steiermarkischen landesregierung
asarlaringizni yuboring
o'zingizning asarlaringizni
Iltimos faqat
faqat o'zingizning
steierm rkischen
landesregierung fachabteilung
rkischen landesregierung
hamshira loyihasi
loyihasi mavsum
faolyatining oqibatlari
asosiy adabiyotlar
fakulteti ahborot
ahborot havfsizligi
havfsizligi kafedrasi
fanidan bo’yicha
fakulteti iqtisodiyot
boshqaruv fakulteti
chiqarishda boshqaruv
ishlab chiqarishda
iqtisodiyot fakultet
multiservis tarmoqlari
fanidan asosiy
Uzbek fanidan
mavzulari potok
asosidagi multiservis
'aliyyil a'ziym
billahil 'aliyyil
illaa billahil
quvvata illaa
falah' deganida
Kompyuter savodxonligi
bo’yicha mustaqil
'alal falah'
Hayya 'alal
'alas soloh
Hayya 'alas
mavsum boyicha


yuklab olish