Оценка значимости уравнения и его параметров
Важный момент: если модуль | rxy | близок к единице и n невелико, то распределение rxy будет отличаться от нормального и от распределения Стьюдента. Чтобы обойти это затруднение, используют специальную статистику:
.
Распределение величины Z приближается к нормальному при любых допустимых значениях r; стандартная ошибка для Z–статистики и соответствующие значения t–статистик имеют вид
Доверительные интервалы для оценок коэффициентов модели с надёжностью 1–γ можно вычислить следующим образом:
3.4. Интервалы прогноза по линейному уравнению регресси
Интервальная оценка для условного математического ожидания объясняемой переменной может быть записана так:
Эта статистика имеет при заданном уровне значимости γ распределение Стьюдента.
Из математической статистики известно, что а ранее вычислено:
В точке прогноза xп получим:
Стандартная ошибка характеризует ошибку положения прямой линии регрессии. Она минимальна при и возрастает по мере удаления от этого значения.
Построенная нами доверительная область для условного математического ожидания определяет местоположение модельной линии регрессии, но не отдельных индивидуальных значений зависимой переменной Y.
Чтобы определить доверительный интервал для индивидуальных значений y* зависимой переменой, следует учесть ещё один источник вариации – рассеяние вокруг самой линии регрессии, то есть . Тогда
и
Изложенные соображения могут быть проиллюстрированы следующим рис. 3.2:
Рис. 3.2