3.5. Точечное и интервальное прогнозирование на основе модели множественной регрессии Основная цель построения регрессионной модели - получение значений зависимой переменной при некоторых заданных значениях независимых переменных, в общем случае не совпадающих с выборочными их значениями, использованными для оценки коэффициентов модели, но принадлежащих той же генеральной совокупности данных. В этом случае говорят о прогнозе регрессанда (зависимой переменной). Следует отличать прогноз математического ожидания регрессанда
и прогноз индивидуального значения регрессанда
как оценку реализации случайной переменной Y, здесь индекс t указывает на значение соответствующей переменной, в общем случае не совпадающее с наблюдаемым. Оба прогноза строятся в соответствии с уравнением
или
где вектор - столбец Xt=(xt1,xt2,...,xtk)T состоит из значений регрессоров, в общем случае не совпадающих с наблюдаемыми, то есть они лежат за пределами наблюдаемой выборки. Конкретные значения регрессоров задаются исследователем - эконометристом в соответствии с поставленной целью исследований. Уравнения (3.61), (3.62) определяют точечные прогнозы указанных величин. Качество этих прогнозов характеризуется дисперсиями ошибок прогнозов и шириной доверительных интервалов. И хотя прогнозы математического ожидания и индивидуального значения регрессанда совпадают (формально они определяются по одинаковым формулам), дисперсии ошибок и доверительные интервалы прогнозов будут различны. Прогноз математического ожидания регрессанда: дисперсия ошибки прогноза и доверительный интервал (интервальный прогноз) Ошибка точечного прогноза математического ожидания
В уравнении (3.63) единственной
случайной величиной является вектор
оценок b. Ошибка прогноза в
классической линейной регрессии
является линейной функцией оценок.
Следовательно, статистические
свойства ошибки определяются
статистическими свойствами оценок
параметров регрессии. Получим
выражение для истинной (теоретической)
дисперсии ошибки прогноза. Вспоминая
определение дисперсии, учитывая
формулу (3.27)
для истинной ковариационной матрицы
вектора оценок, а также то, что в силу
свойства несмещенности оценок
коэффициентов
Полученная формула
определяет теоретическое значение
дисперсии. Оцененное значение
дисперсии ошибки прогноза получится,
если в формуле (3.64)
теоретическое значение дисперсии
случайной составляющей модели
и среднеквадратичное отклонение
Доверительный интервал прогноза математического ожидания регрессанда (интервальный прогноз) определяется следующим образом: нижняя граница
верхняя граница
где Если оценки При определении
доверительного интервала на основе
конкретной выборки он может либо
включать (примерно в 95 случаев из ста,
если Замечание. Нетрудно видеть, что Прогноз индивидуального значения регрессанда: дисперсия ошибки прогноза и доверительный интервал (интервальный прогноз) Ошибка прогноза индивидуального значения регрессанда равна
Дисперсия ошибки
Случайная переменная yt
в классической модели линейной
регрессии имеет дисперсию
Заметим, что дисперсия ошибки прогноза индивидуального значения регрессанда всегда больше (при прочих равных условиях) дисперсии ошибки прогноза его математического ожидания. Эмпирические оценки
дисперсии и среднеквадратического
отклонения получатся, если в
выражении (3.70)
теоретическое значение дисперсии
оценка среднеквадратического отклонения
Границы доверительного интервала для прогноза (интервальный прогноз) можно определить по формулам: нижняя граница
верхняя граница
Очевидно, что поскольку
среднеквадратичное отклонение Пример 3.7. (продолжение примера 3.1.). Определим прогноз доходности компании A при условии, что доходности компаний B и C примут значения x2=0,07 , x3=3,63, и построим доверительные интервалы для прогноза среднего и индивидуального значений доходности компании A. Подставляя значения регрессандов в уравнение регрессии, получим
Среднеквадратичное значение
прогноза среднего вычисляется по
формуле (3.66)
и равно Задание. Выполните прогноз среднего и индивидуального значений зависимой переменной для модели примера 3.2. и постройте соответствующие доверительные интервалы. Свойства точечных и интервальных прогнозов Прогнозные оценки вида (3.62), полученные в данном разделе, являются наилучшими несмещенными линейными оценками, то есть для них справедлива теорема Гаусса-Маркова.
|