4.10. Решение практической задачи: эконометрический анализ рынка квартир

В работе [30] приведены результаты применения многомерных регрессионных моделей для анализа рынка квартир в г. Москве. Этот пример поучителен тем, что показывает методику построения, интерпретации и использования обобщенных многомерных линеаризованных регрессионных моделей, содержащих "фиктивные" переменные, в исследовании реальных экономических процессов.

За основу была взята логарифмическая форма модели, подобная описанной в [25]:

(4.66)

где LNPRICE - логарифм цены квартиры (в долларах США); LNLVSP - логарифм жилой площади (в кв. м.); LNPLAN - логарифм площади нежилых (вспомогательных) помещений (в кв. м.); LNKITSP - логарифм площади кухни (в кв. м.). Остальные переменные являются "фиктивными", каждая из них принимает два значения (такие переменные называются бинарными): переменная FLOOR=1, если квартира расположена на первом или последнем этаже, в противном случае FLOOR=0; BRICK=1, если квартира находится в кирпичном доме, если в панельном - BRICK=0; BAL=1, если вквартире есть балкон, иначе BAL=0; R1=1 , если квартира однокомнатная, иначе R1=0; аналогично определяются переменные R2, R3, R4 для двух-, трех- и четырех комнатных квартир. Прежде чем выбрать модель (4.66) как наиболее адекватно описывающую данные наблюдений, был построен ряд моделей линейной регрессии, в том числе модель вида

(4.67)

в которой вместо логарифмов используются сами значения небинарных переменных. Обе модели оценивались по 1485 наблюдениям, относящимся к 1999 г. Результаты оценивания приведены в таблицах 4.4, 4.5 соответственно.

Таблица 4.4

Таблица 4.5

Коэффициент детерминации, скорректированный коэффициент детерминации и стандартная ошибка логарифмической модели (4.66) равны соответственно .

Для линейной модели (4.67) эти величины равны . Эти данные показывают, что логарифмическая модель более адекватно описывает изучаемую зависимость.

Коэффициентам логарифмической модели (4.66) можно дать следующую интерпретацию. Коэффициент при переменной LNLIVSP означает, что увеличение жилой площади квартиры на 1% приводит к увеличению ее цены (при прочих равных условиях) на 0, 758% , то есть элластичность цены квартиры по жилой площади равна 0,758. Увеличение площади вспомогательных помещений на 1% приводит к увеличению цены квартиры на величину 0,164%, равную значению коэффициента . Кухня относится к нежилым помещениям, но ее площадь входит отдельной переменной в модель. Поэтому увеличение площади кухни на 1% одновременно приводит и к увеличению вспомогательных помещений на 1%. Поэтому, увеличение площади кухни на 1% приводит к увеличению цены квартиры на величину, равную сумме коэффициентов .

Коэффициенты при "фиктивных" переменных можно интерпретировать следующим образом. Отрицательное значение коэффициента при "фиктивной" (бинарной) переменной FLOOR означает, что квартира на первом или последнем этаже стоит (при прочих равных условиях) на 11,6% дешевле, чем аналогичная квартира на других этажах. Можно ожидать, что квартира в кирпичном доме (переменная BRICK=1) будет стоить на 20% дороже такой же квартиры в панельном доме. Квартира с балконом (переменная BAL=1) стоит на 0,7% дороже, чем такая же квартира без балкона.

Кроме рассмотренной выше полной модели, были построены "частные" модели, включающие различные варианты комбинаций объясняющих переменных. Оценивались регрессии следующих видов:

(4.68)

(4.69)

(4.70)

Эти регрессии, очевидно, не включают "фиктивные" переменные. Результаты оценивания данных регрессий приведены в таблицах 4.6, 4.7, 4.8 соответственно.

Таблица 4.6

Таблица 4.7

Таблица 4.8

Сравнивая показатели качества оцененных регрессий (4.68) и (4.69), которые отличаются второй переменной - в (4.68) это общая площадь нежилых помещений, а в (4.69) - площадь кухни (точнее, логарифмы этих величин), можно сделать вывод, что модель (4.69) лучше описывает поведение зависимой переменной LNPRICE, поскольку коэффициент детерминации у нее больше. Отсюда следует, что объясняющая переменная LNKITSP лучше объясняет поведение зависимой переменной, чем переменная LNPLAN.

Для сравнительного анализа влияния бинарных переменных на качество модели рассматривались следующие регрессии:

(4.71)

(4.72)

(4.73)

(4.74)

Результаты оценивания этих регрессий приведены в таблицах 4.9 - 4.12.

Таблица 4.9

Таблица 4.10

Таблица 4.11

Таблица 4.12

Из анализа данных, представленных в таблицах 4.9 - 4.12 можно сделать следующие выводы: 1) регрессии (4.71) - (4.74) плохо объясняют поведение зависимой переменной - коэффициенты детерминации малы; 2) наиболее существенной из включенных в модели (4.71) - (4.74) переменных является переменная FLOOR - модели, где она присутствует, имеют коэффициенты детерминации больше; 3) наименьшее влияние оказывает переменная BAL - ее добавление в модель (4.74) не улучшает качество регрессии.

Для исследования влияния переменных, учитывающих количество комнат в квартире, были построены следующие две регрессии:

(4.75)


(4.76)

Результаты оценивания этих регрессий приведены в таблицах 4.13, 4.14.

Таблица 4.13

Таблица 4.14

Из анализа данных таблиц 4.13, 4.14 и сравнения их с предыдущими расчетами, можно сделать вывод о том, что цена квартиры в большей степени зависит от количества комнат, а не от того, на каком этаже и в каком доме она находится и имеется ли балкон. И, наконец, сравнивая результаты оценивания всех "частных" регрессий (4.68) - (4.76) с полной моделью (4.66), можно сделать вывод, что модель (4.66) наиболее адекватно описывает (и объясняет) процессы, наблюдаемые на рынке жилья.