Эконометрическая модель и экспериментальные данные
Для получения достаточно достоверных и информативных данных о распределении вектора случайной величины необходимо иметь достаточно большую выборку.
Выборка представляет собой совокупность наборов (векторов) значений
Как правило, число наблюдений велико и значительно превосходит число факторных переменных. Опыт показывает, что для получения хороших результатов должно выполняться условие а для получения удовлетворительных результатов должно выполняться условие
Существует такая проблема: наблюдения yi, которые при различных наборах объясняющих переменных рассматриваются как реализации случайных величин Yi, могут в общем случае иметь различные распределения, а это означает, что в конкретной таблице наблюдений для каждой случайной величины будет иметься только одно наблюдение.
В классической эконометрике рассматривают два вида данных:
1. Пространственная выборка или перекрёстные данные (cross-sectional data) – это набор значений показателей, полученный в некоторый момент или за достаточно короткий интервал времени. Таким образом, для пространственной выборки можно говорить, что все ее наблюдения получены примерно в одинаковых условиях.
По другому: пространственная выборка – это серия из n независимых наблюдений (p+1) – мерной случайной величины.
В дальнейшем Xi можно не рассматривать как случайные величины. Если случайные величины Yi для различных i независимы, то это влечёт за собой некоррелированность остатков: Реально проверить, является ли выборка совокупностью независимых наблюдений, весьма непросто. Обычно за независимые наблюдения принимают наблюдения, о которых предполагают, что они независимые причинно.
2. Временной или динамический ряд (time-series data) – это выборка наблюдений, в которой важны не только сами наблюдения, но и порядок следования их друг за другом. При этом предполагается, что тип распределения наблюдаемой случайной величины остается неизменным во времени, но его параметры могут изменяться.
Модели временных рядов оказываются сложнее моделей пространственной выборки, так как наблюдения во временном ряду в общем случае не являются независимыми и остатки могут коррелировать друг с другом.