Грокаем а Иллюстрированное пособие для программистов и любопытствующих



Download 3,16 Mb.
bet66/79
Sana19.02.2022
Hajmi3,16 Mb.
#457977
1   ...   62   63   64   65   66   67   68   69   ...   79
Bog'liq
Грокаем алгоритмы ( PDFDrive )

А.

1

*-

6.

2

<-

с.

Я




D.

2




г.

1

к-

е.

5







Вычисляя среднее арифметическое продаж в эти дни, вы получаете 218,75. Значит, именно столько буханок нужно выпекать на сегодня!


БЛИЗОСТЬ КОСИНУСОВ
До сих пор мы использовали формулу расстояния для вычисления степени сходства двух пользователей. Но является ли эта формула лучшей? На практике также часто применяется метрика близости косинусов. Допустим, два пользователя похожи, но один из них бо­лее консервативен в своих оценках. Обоим пользователям понравил­ся фильм Манмохана Десаи «Амар Акбар Антони». Пол поставил фильму оценку 5 звезд, но Роуэн оценил его только в 4 звезды. Если использовать формулу расстояния, эти два пользователя могут не оказаться соседями, несмотря на сходство вкусов.
Метрика близости косинусов не измеряет расстояние между двумя векторами. Вместо этого она сравнивает углы двух векторов и в це­лом лучше подходит для подобных случаев. Тема метрики близости косинусов выходит за рамки этой книги, но вам стоит самостоятель­но поискать информацию о ней, если вы будете применять алгоритм k ближайших соседей!
Выбор признаков
Ч
тобы подобрать рекомендации, вы предлага­ете пользователям ставить оценки категориям фильмов. А если бы вы вместо этого предла­гали им ставить оценки картинкам с котами?
Наверное, вам бы удалось найти пользовате­лей, которые ставили похожие оценки этим картинкам. Однако у вас полу­чилась бы самая плохая рекомендательная система в мире, потому что эти «признаки» не имеют никакого отношения к их вкусам в области кино!
Или представьте, что вы предлагаете пользователям оценить фильмы для формирования рекомендаций — но только «Историю игрушек», «Историю игрушек-2» и «Историю игрушек-3». Эти оценки ничего не скажут вам о вкусах пользователей.
Когда вы работаете с алгоритмом k ближайших соседей, очень важно пра­вильно выбрать признаки для сравнения. Под правильным выбором при­знаков следует понимать:

  • признаки, напрямую связанные с фильмами, которые вы пытаетесь рекомендовать;

  • признаки, не содержащие смещения (например, если предлагать поль­зователям оценивать только комедии, вы не получите никакой инфор­мации об их отношении к боевикам).

Как вы думаете, оценки хорошо подходят для рекомендации фильмов? Воз­можно, я поставил «Прослушке» более высокую оценку, чем «Охотникам за недвижимостью», но на самом деле я провел больше времени за просмотром «Охотников». Как улучшить рекомендательную систему Netflix?
Возвращаясь к примеру с пекарней: сможете ли вы придумать два хо­роших и два плохих признака, которые можно было бы выбрать для прогнозирования объема выпечки? Возможно, нужно выпечь побольше хлеба после рекламы в газете. Или увеличить объем производства по по­недельникам.
В том, что касается выбора хороших признаков, не существует единственно правильного ответа. Тщательно продумайте все факторы, которые необхо­димо учесть при прогнозировании.
Упражнения

  1. У сервиса Netflix миллионы пользователей. В приведенном ранее примере рекомендательная система строилась для пяти ближайших соседей. Пять — это слишком мало? Слишком много?

З

Я

накомство с машинным обучением
М ало того, что алгоритм k ближайших соседей поле­зен он открывает путь в волшебный мир машинно­го обучения! Суть машинного обучения сдела-' ваш компьютер более разумным. Вы уже видел один пример машинного обучения: построение рекомендательной системы. В этом разделе будут рассмотрены другие примеры.
OCR
С
окращение OCR означает «Optical Character Recognition», то есть «оп­тическое распознавание текста». Иначе говоря, вы берете фотографию страницы текста, а компьютер автоматически преобразует изображение в текст. Google использует OCR для оцифровки книг. Как работает OCR? Для примера возьмем следующую цифру:
Как автоматически определить, что это за цифра? Можно воспользоваться алгоритмом к ближайших соседей:

  1. Переберите изображения цифр и извлеките признаки.

  2. Получив новое изображение, извлеките признаки и проверьте ближай­ших соседей.

П

Download 3,16 Mb.

Do'stlaringiz bilan baham:
1   ...   62   63   64   65   66   67   68   69   ...   79




Ma'lumotlar bazasi mualliflik huquqi bilan himoyalangan ©hozir.org 2024
ma'muriyatiga murojaat qiling

kiriting | ro'yxatdan o'tish
    Bosh sahifa
юртда тантана
Боғда битган
Бугун юртда
Эшитганлар жилманглар
Эшитмадим деманглар
битган бодомлар
Yangiariq tumani
qitish marakazi
Raqamli texnologiyalar
ilishida muhokamadan
tasdiqqa tavsiya
tavsiya etilgan
iqtisodiyot kafedrasi
steiermarkischen landesregierung
asarlaringizni yuboring
o'zingizning asarlaringizni
Iltimos faqat
faqat o'zingizning
steierm rkischen
landesregierung fachabteilung
rkischen landesregierung
hamshira loyihasi
loyihasi mavsum
faolyatining oqibatlari
asosiy adabiyotlar
fakulteti ahborot
ahborot havfsizligi
havfsizligi kafedrasi
fanidan bo’yicha
fakulteti iqtisodiyot
boshqaruv fakulteti
chiqarishda boshqaruv
ishlab chiqarishda
iqtisodiyot fakultet
multiservis tarmoqlari
fanidan asosiy
Uzbek fanidan
mavzulari potok
asosidagi multiservis
'aliyyil a'ziym
billahil 'aliyyil
illaa billahil
quvvata illaa
falah' deganida
Kompyuter savodxonligi
bo’yicha mustaqil
'alal falah'
Hayya 'alal
'alas soloh
Hayya 'alas
mavsum boyicha


yuklab olish