Машинное зрение.
Подбор предсказательного или объяснительного
уравнения, однако, не исчерпывает круг вопросов, которые решает ко-
личественный подход. Часто нет переменной, которая бы учила модель,
но есть множество показателей, по которым мы ищем порядок в наборе
наблюдений. Знакомый географам пример – дешифровка снимков.
Для этой цели используют машинное зрение. В наше время оно
успешно распознает типы застройки и транспортные средства (с точно-
стью 90–95%): автомобили [13], вагоны, самолеты [14]. Внедрение этой
технологии приводит к размыванию понятия дешифровочного призна-
ка. В самом деле, мы не можем точно сказать, почему машина отлича-
ет один объект от другого – существует некий вектор в многомерном
прострастве, характеризующий область, свойственную объекту в про-
странстве признаков. Обучаясь, классификатор самостоятельно выде-
ляет характерные особенности изображения – в обучающую выборку
входят простые изображения объектов, без каких-либо характеристик.
История машинного зрения показала, что для успеха количественного
метода необходимо выполнение четырех условий:
1) развитой математический аппарат;
2) программное обеспечение на его основе;
3) наличие достаточных вычислительных мощностей;
4) наличие достаточного объёма материала для исследований.
Новый количественный подход к экономико-географическим вопросам
54
В основе современного машинного зрения лежит теория перцептро-
на – компьютерной модели нейрона. Эту теорию разработали уже к се-
редине 60-х гг. ХХ в. [5]. К началу 1990-х гг. были созданы основные
алгоритмы машинного обучения – метод обратного распространения
ошибки [2, 23] и нелинейный классификатор на основе метода опорных
векторов [10]. Вскоре удалось распознать цифры на бумаге [22].
Но, несмотря на широкое распространение компьютеров на рубеже
тысячелетий, машине удалось приблизиться по качеству распознава-
ния образов с человеком буквально несколько лет назад – не хватало
размеченных обучающих выборок (в Интернете сравнительно недав-
но накопились тысячи изображений одного предмета) – сети плохо
обобщают на малых объёмах данных. Это хороший пример того, как
много факторов должно сойтись для успеха количественного метода:
от появления концепции до широкого распространения распознавания
образов прошло полвека.
Процесс машинного зрения можно разделить на два этапа: анализ
изображения и классификация результатов анализа.
Есть несколько методов анализа изображения: вейвлет-преобразова-
ния; HOG (гистограммы ориентированных градиентов), LBP (локаль-
ный бинарный шаблон), DNN (глубокие свёрточные нейронные сети).
Для классификации используют либо нейронную сеть (NN) с ал-
горитмом обратного распространения ошибки или алгоритмом Ле-
венберга-Марквардта, либо метод опорных векторов (SVM). Есть
ещё несколько классификаторов, но они менее популярны. Например,
Adaptive Boosting менее подвержен переобучению, но чувствителен
к выбросам и шуму.
Сравним разные методы на примере задачи распознавания автомо-
билей на аэрофотоснимках.
Для определения качества распознавания изображения используются
метрики Precision Rate (точность) и Recall Rate (возврат):
Мера PR позволяет учесть ложные распознавания. Автобусная оста-
новка или киоск похожи на снимке на автомобиль, поэтому алгоритм
может посчитать их транспортными средствами. Иными словами, это
мера лишних объектов:
Ростислав К.В., Синицын Н.А.
Do'stlaringiz bilan baham: |