Глава 1. Глубокое обучение и JavaScript
35
Данные демонстрируют определенную закономерность в блоке A на рис. 1.4.
Как может машина определить цвет точки по заданным координатам
x
и
y
? Про
сто сравнить
x
с числом не получится, ведь диапазон
x
координат белых точек
пересекается с диапазоном
x
координат черных! Аналогично алгоритм не может
воспользоваться для этой цели и
y
координатами. Следовательно, становится ясно,
что исходное представление плохо подходит для задачи классификации на белые
и черные точки.
Нам нужно новое представление, на котором точки двух цветов разделялись бы
более понятным образом. В данном случае мы преобразовали исходное декартово
x
y
представление в представление в полярной системе координат. Другими слова
ми, мы поставили каждой точке в соответствие: 1) ее угол — угол, сформированный
осью
X
и прямой, соединяющей начало координат с этой точкой (см. пример в бло
ке A на рис. 1.4); 2) ее радиус — расстояние от начала координат. После этого преоб
разования получаем новое представление того же набора данных, как демонстрирует
блок Б на рис. 1.4. Это представление лучше подходит для решения нашей задачи,
поскольку диапазоны углов для черных и белых точек теперь вообще не пересекают
ся. Впрочем, это новое представление все еще неидеальное, поскольку не позволяет
выполнить классификацию на точки белого и черного цветов, просто сравнивая угол
с пороговым значением (например, с нулем).
К счастью, для этого можно применить еще одно преобразование, основанное на
простой формуле:
(абсолютное значение угла) — 135 градусов
Полученное в результате представление, как видно из блока В, является одномер
ным. По сравнению с представлением из блока Б, в нем отброшена не относящаяся
к делу информация о расстоянии от точек до начала координат. Но это представ
ление идеально в том, что обеспечивает исключительно простой процесс принятия
решения:
если значение < 0, то точка относится к белым;
в противном случае точка относится к черным
В примере мы вручную задали двухшаговое преобразование представления
данных. Вместо этого можно попытаться автоматически найти различные возмож
ные преобразования координат на основе обратной связи о количестве правильно
классифицированных точек. Это и будет машинным обучением. Число шагов пре
образования при решении настоящих задач машинного обучения обычно намного
превышает два, особенно при глубоком обучении, где может достигать сотен. Кроме
того, в настоящем машинном обучении преобразования представлений обычно
выглядят намного сложнее, по сравнению с показанными в этом простом примере.
Непрерывные исследования в области глубокого обучения открывают все новые
и все более перспективные преобразования. Но пример на рис. 1.4 демонстрирует
саму суть поиска лучших преобразований. Это относится ко всем алгоритмам ма
шинного обучения, включая нейронные сети, деревья принятия решений, ядерные
методы и т. д.
36
Do'stlaringiz bilan baham: |