Аналогично, рассматривая гольфиста, который набрал на 5 очков
больше пара, есть причины сделать вывод, что он — довольно слабый
игрок и у него был плохой день. Конечно, вы не знаете ни того ни другого
наверняка. Вполне возможно,
что игрок, набравший 77 очков, в
действительности очень талантлив, но у него выдался совершенно ужасный
день. Хотя следующие выводы из счета по окончании первого дня
неокончательны, они вполне правдоподобны и чаще всего будут верными.
результат лучше среднего в 1-й день = талант выше среднего + удача в
1-й день и результат хуже среднего в 1-й день = талант меньше среднего +
неудача в 1-й день
Теперь предположим, что вам известен результат гольфиста в первый
день, и требуется предсказать его на второй. Вы ожидаете, что уровень
таланта останется тем же, так что лучшее, что можно предположить для
первого гольфиста, — «лучше среднего», а для второго — «хуже среднего».
Удача, конечно, другое дело. Поскольку невозможно предсказать везение
гольфистов во второй — да и в любой другой — день, лучший вариант:
предположить, что оно будет средним, без особенностей. Это означает, что,
в отсутствие другой информации, не стоит в своих догадках относительно
второго дня повторять результаты игроков в первый день.
Можно сказать
лишь следующее:
• Гольфист, успешно сыгравший в первый день, вероятно, на второй
день тоже сыграет успешно, но не так хорошо, поскольку необычное
везение вряд ли сохранится.
• Гольфист, сыгравший плохо в первый день, скорее всего, и во второй
день сыграет хуже среднего, но лучше по
сравнению с предыдущим
результатом, поскольку его вероятное невезение должно прекратиться.
Также ожидается, что разница между двумя гольфистами на второй
день уменьшится, хотя надежнее всего предположить, что первый все
равно сыграет лучше второго.
Мои студенты всегда удивляются тому, что лучшие предсказания
результатов второго дня — более скромные и близкие к среднему,
чем те
результаты, на которых предсказания основаны. Именно поэтому такая
модель называется регрессией к среднему. Чем выше исходные данные, тем
сильнее ожидаемое сокращение, поскольку чрезвычайно хороший
результат предполагает очень счастливый день. Регрессивное предсказание
разумно, но его точность не гарантируется. Некоторые гольфисты,
набравшие 66 в первый день, во второй справятся еще лучше, если им
повезет еще больше. Большинство игроков справятся хуже,
поскольку их
удача уже не будет выше средней.
Теперь давайте взглянем в прошлое. Отсортируйте игроков по
результатам второго дня и посмотрите на их результаты в первый день:
обнаружится точно такая же регрессия к среднему. Лучшим гольфистам
второго дня, вероятнее всего, сопутствовала удача, и надежнее всего
предположить, что в первый день им везло меньше и их результат был
хуже. Тот факт, что регрессия наблюдается и при попытках предсказать
более раннее событие по более позднему, должен убедить вас в том, что у
нее нет каузального объяснения.
Эффекты
регрессии встречаются везде, а вместе с ними — и
ошибочные объяснения их причин. Известный пример — «проклятие
Sports Illustrated». Утверждают, что спортсмен, чей портрет опубликован на
обложке журнала, обречен на плохие результаты в следующем сезоне. В
качестве причины часто называют излишнюю самоуверенность и боязнь не
соответствовать ожиданиям, однако существует и более простое
объяснение. Спортсмен попадает на обложку Sports Illustrated в том случае,
если он добился исключительных результатов в предыдущем сезоне, в том
числе, вероятно, и при помощи удачи — а она непостоянна.
По странному совпадению, когда мы с Амосом писали об
интуитивных предсказаниях, я смотрел зимние Олимпийские игры —
соревнования мужчин по прыжкам на лыжах с трамплина. У каждого
участника есть две попытки, которые объединяются в окончательный
результат. Я с удивлением слушал заявления
комментатора во время
подготовки ко второму прыжку: «Норвежец отлично выполнил первый
прыжок, теперь спортсмен напряжен, постарается защитить свою позицию
и, вероятнее всего, прыгнет хуже» или «Шведский спортсмен плохо
выполнил первый прыжок, он знает, что ему нечего терять, будет
расслаблен, и это поможет ему прыгнуть лучше». Комментатор заметил
регрессию к среднему и придумал совершенно безосновательные
объяснения, которые тем не менее
вполне могли соответствовать
действительности. Если бы мы измерили пульс спортсменов перед каждым
прыжком, то, возможно, обнаружили бы, что они более расслаблены после
первой неудачи. Или не обнаружили бы. Важно помнить о том, что не
следует искать объяснений изменению результатов между двумя
попытками. Это — математически неизбежное следствие того факта, что на
исход
первого
прыжка
влияла
удача.
История
не
слишком
удовлетворительная — нам всем больше понравилось бы каузальное
объяснение, — но другой нет.