Влияние на качество модели множественной регрессии избыточных переменных и отсутствия существенных переменных

Пусть истинная модель представляется в виде

а мы считаем, что моделью является регрессионное уравнение

,

и рассчитываем оценку величины b1 по формуле

вместо формулы

В целом проблемы смещения оценки здесь нет, но в общем случае оценка будет неэффективной в смысле наличия большей дисперсии, чем при правильной спецификации. Это легко понять интуитивно. Истинная модель может быть записана в виде

Здесь b1 будет являться несмещенной оценкой параметра β1, а b2 будет несмещенной оценкой нуля (при выполнении условий Гаусса–Маркова).

Утрата эффективности в связи с включением x2 в случае, когда она не должна быть включена, зависит от корреляции между x1 и x2 (см. табл. 4.1).

Таблица 4.1

Парная регрессия