Гомо- и гетероскедастичность остатков в регрессионных моделях
Термин гетероскедастичность в широком смысле означает предположение о дисперсии случайных ошибок регрессионной модели. Случайная ошибка - отклонение в модели линейной множественной регрессии: . Величина случайной регрессионной ошибки является неизвестной, поэтому вычисляется выборочная оценка случайной ошибки регрессионной модели по формуле:
, где
- остатки регрессионной модели. Нормальная линейная регрессионная модель строится на основании следующих предположения о случайной ошибке: Матожидание случайной ошибки уравнения регрессии равно 0 во всех наблюдениях:
, где
. Дисперсия случайной ошибки уравнения регрессии является постоянной для всех наблюдений:
. Случайные ошибки уравнения регрессии не коррелированны между собой, то есть ковариация случайных ошибок любых двух разных наблюдений равна 0:
, где
. Условие
трактуется как гомоскедастичность (однородный разброс) дисперсий случайных ошибок регрессионной модели. Гомоскедастичность - это предположение от том, что дисперсии случайной ошибки
является известной постоянной величиной для всех
наблюдений регрессионной модели. Предположение о том, что дисперсии случайных ошибок являются разными величинами для всех наблюдений, называется гетероскедастичностью (неоднородный разброс).
, где
. Условие гетероскедастичности можно записать через ковариационную матрицу случайных ошибок регрессионной модели.
, где
. Обнаружение гетероскедастичности. Существует несколько тестов на обнаружение гетероскедастичности в регрессионной модели. Тест Глейзера. На первом этапе строится обычная регрессионная модель:
Методом наименьших квадратов вычисляются оценки коэффициентов построенной модели:
На следующем этапе вычисляются остатки регрессионной модели:
. Полученные регрессионные остатки возводятся в квадрат
. С целью обнаружение гетероскедастичности определяется коэффициент Спирмена. Коэффициент Спирмена является аналогом парного коэффициента корреляции, но позволяет выявить взаимосвязь между качественным и количественным признаками:
, где d - ранговая разность (
-
); n - количество пар вариантов. Значимость коэффициента Сирмена проверяется с помощью t-критерия Стьюдента.
Критическое значение определяется по таблице распределения Стьюдента:
. Если
, то основная гипотеза отвергается, и между переменной
и остатками регрессионной модели
существует взаимосвязь, то есть в модели присутствует гетероскедастичность. Устранение гетероскедастичности. Наиболее простым методом устранение гетероскедастичности является взвешивание параметров регрессионной модели. Суть метода состоит в том, что отдельным наблюдениям независимой переменной с максимальным среднеквадратическим отклонением случайной ошибки придается больший вес, а остальным наблюдениям с минимальным среднеквадратическим отклонением случайной ошибки придается меньший вес. Благодаря этому оценки коэффициентов уравнения остаются эффективными. Модель регрессии при таком подходе называется взвешенной регрессией с весами
. После нахождения оценок дисперсий остатков можно воспользоваться доступным обобщенным или взвешенным методом наименьших квадратов для вычисления оценок коэффициентов уравнения регрессии, которые различаются лишь оценкой
. Если нельзя выполнить коррекцию гетероскедастичности, то вполне возможно вычислить оценки коэффициентов уравнения регрессии по обычному МНК, но корректировать ковариационную матрицу оценок коэффициентов
, так как условие гетероскедастичности приводит к увеличению данной матрицы.
Другие статьи
Формирование прибыли торгового предприятия и оценка перспектив ее роста (на материалах ООО Универмаг Советский)
Основную
цель деятельности любого торгового предприятия составляет максимизация прибыли.
Возможности её получения ограничены, во-первых, издержками и, во-вторых,
спросом на продукцию. Поэтому в системе экономического анализа, большое
значение имеет исследование закономерностей формир ...