4.5. Регрессионные модели с переменной структурой. Использование "фиктивных" переменных

При построении классической регрессионной модели и ее обобщений предполагалось, что выполнена следующая предпосылка относительно коэффициентов модели: это постоянные и неслучайные величины. Значения коэффициентов , p=1,2,…,k, одинаковы для всех элементов наблюдаемой пространственной или временной выборки. Однако, одна и та же пространственная выборка может содержать данные о неоднородных объектах, либо, во временных выборках - данные, отражающие структурные изменения в изучаемом объекте, происходящие с течением времени, например, сезонные изменения зависимостей. В этом случае классическая регрессия не будет соответствовать наблюдаемым данным - модель не будет адекватной.

Если подобные структурные изменения в выборке носят скачкообразный не случайный характер, то можно однозначно сопоставить подмножества (подвыборку) пространственных наблюдений соответствующим однородным группам объектов, или во временной выборке - точно определить моменты изменения структуры. В этом случае путем введения так называемых "фиктивных " переменных (синонимы - искусственные, вспомогательные, индикаторные переменные), в рамках классической модели можно учесть структурные изменения. Рассмотрим схему применения этого метода.

Пусть дано неполностью специфицированное линейное регрессионное уравнение с числом регрессоров, равным

(4.47)

Предположим, что коэффициент при некотором значении i скачкообразно изменяется. Что бы отразить этот факт, введем дополнительный индекс у этого параметра: . Примем, что закон изменения описывается функцией

где - бинарная переменная, принимающая значение 1 для всех i, в которых предполагается изменение p - го регрессионного коэффициента на величину относительно его номинального значения (то есть, значения которое коэффициент имел до изменения). Умножив коэффициент на соответствующий ему регрессор, получим

Введем новый, k0+1 - ый регрессор , а соответствующий ему регрессионный коэффициент переобозначим . Добавим в модель (4.47) дополнительное слагаемое с новым регрессором. Очевидно, дополнительный регрессор равен значению регрессора для наблюдений, соответствующих измененному коэффициенту при этом регрессоре, и равен нулю, если наблюдения соответствуют номинальным (не измененным) значениям коэффициента. Коэффициенты модели с дополнительными регрессорами рассматриваются как постоянные величины. Если - вспомогательная переменная при свободном члене, принимающая значение 1 для всех i, то новый регрессор будет бинарной переменной. Коэффициент показывает, насколько изменится для той части выборки, где .

Гипотезы о структурных изменениях формулируются следующим образом: гипотеза для всех i =1,2,…,n; альтернативная гипотеза хотя бы для одного i.

Пример использования "фиктивных" переменных при решении практической задачи рассматривается в п. 4.10.