Влияние на качество модели множественной регрессии избыточных переменных и отсутствия существенных переменных
Пусть истинная модель представляется в виде
а мы считаем, что моделью является регрессионное уравнение
,
и рассчитываем оценку величины b1 по формуле
вместо формулы
В целом проблемы смещения оценки здесь нет, но в общем случае оценка будет неэффективной в смысле наличия большей дисперсии, чем при правильной спецификации. Это легко понять интуитивно. Истинная модель может быть записана в виде
Здесь b1 будет являться несмещенной оценкой параметра β1, а b2 будет несмещенной оценкой нуля (при выполнении условий Гаусса–Маркова).
Утрата эффективности в связи с включением x2 в случае, когда она не должна быть включена, зависит от корреляции между x1 и x2 (см. табл. 4.1).
Таблица 4.1
Парная регрессия |