7.6. Краткие итоги
Метод k-ближайших соседей представляет собой ме-
тод классификации элементов данных путем их соот-
несения с ближайшими элементами.
k — число таких ближайших элементов для расчета,
которое определяется с помощью кросс-валидации.
Лучше всего он работает при условиях, когда предик-
торов немного, а классы примерно одного размера.
Неточные классификации могут служить верным
признаком возможных аномалий.
8
Метод
опорных векторов
8.1 «Нет» или «о, нет!»?
Медицинский диагноз — сложная задача. Симптомов,
которые необходимо принять во внимание, может быть
много, а сам процесс не исключает влияния субъектив-
ного мнения врачей. Иногда правильный диагноз ста-
вится лишь тогда, когда уже слишком поздно. Систем-
ный подход для точного прогноза в сфере диагностики
заболеваний заключается в использовании алгоритмов,
обученных на медицинских базах данных.
В этой главе мы рассмотрим способ прогнозирования,
известный как метод опорных векторов (support vector
machine). Этот метод выявляет оптимальную границу для
классификации, которая может быть использована для
разделения пациентов на две группы (то есть здоровых
и нездоровых).
8.2. Пример: обнаружение
сердечно-сосудистых заболеваний
Сердечно-сосудистые заболевания (ССЗ) — одни из самых
распространенных в развитых странах. При ССЗ сужение
8.2. Пример: обнаружение сердечно-сосудистых заболеваний
119
и закупорка кровеносных сосудов увеличивают риск ин-
фаркта. Заболевание может быть окончательно диагно-
стировано посредством томографии, но ее стоимость не
позволяет людям обследоваться регулярно. Альтернатив-
ным решением может стать выявление на основе физио-
логических симптомов пациентов с высокой долей риска,
которые более всего нуждаются в таком обследовании.
Для определения того, какие симптомы предшествуют
ССЗ, пациентов американской клиники попросили делать
упражнения, а затем регистрировали их физическое состо-
яние. Среди учитываемых показателей был и максималь-
ный пульс во время занятий. Вслед за этим для проверки
наличия заболеваний использовалась томография. Была
построена модель с использованием метода опорных
векторов, учитывающая данные о пульсе и возрасте па-
циентов (рис. 1). С помощью нее удается с 75 %-ной ве-
роятностью предсказать, если кто-то страдает от ССЗ.
В основном пациенты с ССЗ (черные точки) имели не-
высокий пульс во время упражнений по сравнению со
здоровыми (светлые точки) того же возраста. Заболева-
ния оказались более распространены среди пациентов
старше 55 лет.
Хотя пульс обычно снижается с возрастом, пациенты
с ССЗ, которым около 60 лет, продемонстрировали более
высокий пульс по сравнению со здоровыми молодыми
людьми, что показано в виде неожиданной дуги на разде-
ляющей границе. Если бы не способность метода опорных
векторов находить криволинейные паттерны, мы могли
бы упустить из виду это явление.
Do'stlaringiz bilan baham: |