β
=
[
β
1
, β
2
, . . . , β
K
]
. Произведение строки и столбца всегда будет записы-
ваться в виде
β
x
=
β
1
x
1
+
β
2
x
2
+
· · ·
+
β
K
x
K
. Элементы матрицы
X
образуют
набор векторов. Разлагая на столбцы, получаем
X
= [
x
1
,
x
2
, . . . ,
x
K
]
— каж-
дый столбец есть вектор размера
n
×
1
. Единственным, к сожалению, неиз-
бежным источником путаницы здесь может быть обозначение, используе-
мое для строки матрицы
X
. Элементы
i
-й строки
X
образуют вектор-строку
x
i
= [
x
i
1
, x
i
2
, . . . , x
iK
]
. Если матрица
X
обозначает матрицу данных, мы бу-
дем индексом
i
обозначать наблюдения (строки), а
k
— переменные (столб-
цы). Как мы уже отметили, к сожалению, при этом может казаться, что
x
i
,
полученный транспонированием
x
i
, будет
i
-м столбцом
X
, что является кон-
фликтом нашихправил записи. Однако нам ничего другого не остается, и
мы будем следовать этим правилам,
всегда
обозначая за
x
i
вектор-строку,
полученную из
i
-й строки матрицы
X
. Обсуждение использующихся в этой
книге результатов из матричной алгебры приведено в приложении А. Осо-
бенную важность представляет результат раздела А.2.7 о суммировании и
об элементахматрицы произведения матриц
X
X
.
ГЛАВА 2
Модель линейной регрессии
2.1. Введение
Эконометрика занимается
построением моделей
. В начале нашего обсуж-
дения рассмотрим такой интересный вопрос: а что такое модель? Описание
модели обычно начинают с наблюдения или предположения о том, что од-
на переменная вызывается другой или ее изменение связано с изменени-
ями другой или с какого-либо другого качественного высказывания о на-
личии связей между переменной и одной или несколькими
ковариатами
,
которые предположительно связаны с интересующей нас переменной. Мо-
дель может содержать общее высказывание поведенческого плана, напри-
мер, что пользование услугами здравоохранения зависит среди прочего от
оценки потребителями собственного здоровья, демографическихпоказате-
лей, например уровня дохода, возраста и уровня образования, а также от
наличия у нихмедицинской страховки и ее вида. Это высказывание мо-
жет быть представлено как вербально, так и в графическом виде, напри-
мер в виде блок-схемы или
графа
, описывающего направления ожидаемых
причинно-следственныхсвязей. Эконометрическая модель редко возника-
ет сразу в виде набора уравнений. Обычно она начинается с
идеи
о наличии
какой-то зависимости. Следующим естественным шагом для эконометри-
ста является перевод этой идеи в набор уравнений, причем надо иметь в
виду, что какую-то часть этихуравнений можно было бы далее использовать
для получения ответов на вопросы о поведении интересующей исследовате-
ля переменной. В нашем примере более четким вопросом, ответ на который
можно пытаться получить из формальной модели, мог бы быть, например,
вопрос о зависимости между использованием услуг системы здравоохране-
ния и медицинской страховкой. Точнее, является ли эта зависимость «по-
ложительной», т.е. склонен ли при прочихравныхболее полно застрахован-
ный потребитель «потреблять больше услуг системы здравоохранения», или
«отрицательной»? Или же можно задаться более точным вопросом: насколь-
ко больше (или меньше)? Эта глава и несколько последующихописывают
инструментарий, которым эконометристы пользуются при построении мо-
делей для поиска ответов на подобные вопросы с использованием данных
и эконометрическихметодов.
С точки зрения чисто статистической исследователь может думать о пе-
ременной
y
(условно «уровень спроса на услуги здравоохранения
H
») и век-
торе ковариат
x
(доход
I
, страховка
T
) как о переменных, имеющих со-
вместное распределение
p
(
H, I, T
)
. Будучи записанной в такой форме, за-
висимость не представляется особенно интересной: какой статистический
процесс порождает спрос на услуги здравоохранения, уровень дохода и тип
страхования? Однако нужно учесть, что
p
(
H, I, T
) =
p
(
H
|
I, T
)
p
(
I, T
)
и,
14
Do'stlaringiz bilan baham: |