Гомо- и гетероскедастичность остатков в регрессионных моделях
Термин гетероскедастичность в широком смысле означает предположение о дисперсии случайных ошибок регрессионной модели. Случайная ошибка - отклонение в модели линейной множественной регрессии: . Величина случайной регрессионной ошибки является неизвестной, поэтому вычисляется выборочная оценка случайной ошибки регрессионной модели по формуле: , где - остатки регрессионной модели. Нормальная линейная регрессионная модель строится на основании следующих предположения о случайной ошибке: Матожидание случайной ошибки уравнения регрессии равно 0 во всех наблюдениях: , где . Дисперсия случайной ошибки уравнения регрессии является постоянной для всех наблюдений: . Случайные ошибки уравнения регрессии не коррелированны между собой, то есть ковариация случайных ошибок любых двух разных наблюдений равна 0: , где . Условие трактуется как гомоскедастичность (однородный разброс) дисперсий случайных ошибок регрессионной модели. Гомоскедастичность - это предположение от том, что дисперсии случайной ошибки является известной постоянной величиной для всех наблюдений регрессионной модели. Предположение о том, что дисперсии случайных ошибок являются разными величинами для всех наблюдений, называется гетероскедастичностью (неоднородный разброс). , где . Условие гетероскедастичности можно записать через ковариационную матрицу случайных ошибок регрессионной модели. , где . Обнаружение гетероскедастичности. Существует несколько тестов на обнаружение гетероскедастичности в регрессионной модели. Тест Глейзера. На первом этапе строится обычная регрессионная модель: Методом наименьших квадратов вычисляются оценки коэффициентов построенной модели: На следующем этапе вычисляются остатки регрессионной модели: . Полученные регрессионные остатки возводятся в квадрат . С целью обнаружение гетероскедастичности определяется коэффициент Спирмена. Коэффициент Спирмена является аналогом парного коэффициента корреляции, но позволяет выявить взаимосвязь между качественным и количественным признаками: , где d - ранговая разность (-); n - количество пар вариантов. Значимость коэффициента Сирмена проверяется с помощью t-критерия Стьюдента. Критическое значение определяется по таблице распределения Стьюдента: . Если , то основная гипотеза отвергается, и между переменной и остатками регрессионной модели существует взаимосвязь, то есть в модели присутствует гетероскедастичность. Устранение гетероскедастичности. Наиболее простым методом устранение гетероскедастичности является взвешивание параметров регрессионной модели. Суть метода состоит в том, что отдельным наблюдениям независимой переменной с максимальным среднеквадратическим отклонением случайной ошибки придается больший вес, а остальным наблюдениям с минимальным среднеквадратическим отклонением случайной ошибки придается меньший вес. Благодаря этому оценки коэффициентов уравнения остаются эффективными. Модель регрессии при таком подходе называется взвешенной регрессией с весами . После нахождения оценок дисперсий остатков можно воспользоваться доступным обобщенным или взвешенным методом наименьших квадратов для вычисления оценок коэффициентов уравнения регрессии, которые различаются лишь оценкой . Если нельзя выполнить коррекцию гетероскедастичности, то вполне возможно вычислить оценки коэффициентов уравнения регрессии по обычному МНК, но корректировать ковариационную матрицу оценок коэффициентов , так как условие гетероскедастичности приводит к увеличению данной матрицы.
Другие статьи
Уровень и качество жизни населения как основные критерии устойчивого социально-экономического развития общества в Республике Беларусь
Уровень жизни (благосостояние) населения - сложное социально
- экономическое понятие. Знания об уровне жизни всего дает анализ условий
(потребностей), удовлетворение которых необходимо для жизнедеятельности.
Важнейшие среди них (первая группа потребностей) - питание, потребление одежд ...