Гомо- и гетероскедастичность остатков в регрессионных моделях
Термин гетероскедастичность в широком смысле означает предположение о дисперсии случайных ошибок регрессионной модели. Случайная ошибка - отклонение в модели линейной множественной регрессии: . Величина случайной регрессионной ошибки является неизвестной, поэтому вычисляется выборочная оценка случайной ошибки регрессионной модели по формуле:
, где
- остатки регрессионной модели. Нормальная линейная регрессионная модель строится на основании следующих предположения о случайной ошибке: Матожидание случайной ошибки уравнения регрессии равно 0 во всех наблюдениях:
, где
. Дисперсия случайной ошибки уравнения регрессии является постоянной для всех наблюдений:
. Случайные ошибки уравнения регрессии не коррелированны между собой, то есть ковариация случайных ошибок любых двух разных наблюдений равна 0:
, где
. Условие
трактуется как гомоскедастичность (однородный разброс) дисперсий случайных ошибок регрессионной модели. Гомоскедастичность - это предположение от том, что дисперсии случайной ошибки
является известной постоянной величиной для всех
наблюдений регрессионной модели. Предположение о том, что дисперсии случайных ошибок являются разными величинами для всех наблюдений, называется гетероскедастичностью (неоднородный разброс).
, где
. Условие гетероскедастичности можно записать через ковариационную матрицу случайных ошибок регрессионной модели.
, где
. Обнаружение гетероскедастичности. Существует несколько тестов на обнаружение гетероскедастичности в регрессионной модели. Тест Глейзера. На первом этапе строится обычная регрессионная модель:
Методом наименьших квадратов вычисляются оценки коэффициентов построенной модели:
На следующем этапе вычисляются остатки регрессионной модели:
. Полученные регрессионные остатки возводятся в квадрат
. С целью обнаружение гетероскедастичности определяется коэффициент Спирмена. Коэффициент Спирмена является аналогом парного коэффициента корреляции, но позволяет выявить взаимосвязь между качественным и количественным признаками:
, где d - ранговая разность (
-
); n - количество пар вариантов. Значимость коэффициента Сирмена проверяется с помощью t-критерия Стьюдента.
Критическое значение определяется по таблице распределения Стьюдента:
. Если
, то основная гипотеза отвергается, и между переменной
и остатками регрессионной модели
существует взаимосвязь, то есть в модели присутствует гетероскедастичность. Устранение гетероскедастичности. Наиболее простым методом устранение гетероскедастичности является взвешивание параметров регрессионной модели. Суть метода состоит в том, что отдельным наблюдениям независимой переменной с максимальным среднеквадратическим отклонением случайной ошибки придается больший вес, а остальным наблюдениям с минимальным среднеквадратическим отклонением случайной ошибки придается меньший вес. Благодаря этому оценки коэффициентов уравнения остаются эффективными. Модель регрессии при таком подходе называется взвешенной регрессией с весами
. После нахождения оценок дисперсий остатков можно воспользоваться доступным обобщенным или взвешенным методом наименьших квадратов для вычисления оценок коэффициентов уравнения регрессии, которые различаются лишь оценкой
. Если нельзя выполнить коррекцию гетероскедастичности, то вполне возможно вычислить оценки коэффициентов уравнения регрессии по обычному МНК, но корректировать ковариационную матрицу оценок коэффициентов
, так как условие гетероскедастичности приводит к увеличению данной матрицы.
Другие статьи
Технико-экономический анализ деятельности предприятий
Анализ и диагностика финансово-хозяйственной деятельности предприятия основывается на такой науке как экономический анализ. Экономический анализ представляет собой систему специализированных знаний, которая связана:
· с исследованием экономических процессов в их взаимосвязи, складываю ...