Спецификация моделей парной регрессии. Множественная регрессия.(Спецификация модели.) Спецификация модели выбор уравнения регрессии

В зависимости от количества факторов, включенных в уравнение регрессии, различают парную и множественную регрессии.

Уравнение взаимосвязи двух переменных и x называют парной регрессией , а зависимость y от нескольких объясняющих переменных = (x 1 , x 2 , ... x n )– множественной регрессией .

Уравнение парной регрессии имеет вид:

где - независимая переменная, влияющая на у ; – коэффициенты модели.

Как уже отмечалось, на первом этапе эконометрического исследования проводится выбор формы взаимосвязи переменных, т.е. осуществляется спецификация уравнения регрессии. С этой целью их круга факторов, влияющих на результирующую переменную у , выделяются наиболее существенно влияющие факторы. Парная регрессия считается достаточной, если можно выделить доминирующий фактор, который используется в качестве объясняющей (независимой) переменной. От правильности выбора спецификации модели зависит величина случайных ошибок: они тем меньше, чем ближе фактические данные у к рассчитанным по построенному уравнению значениям .

К ошибкам спецификации модели относится не только неправильный выбор той или иной математической функции f взаимосвязи переменных у и , но недоучет в уравнении регрессии какого-либо существенного фактора, т.е. использование парной регрессии вместо множественной.

В парной регрессии выбор математической функции можно осуществить графически, аналитически и экспериментальным путем.

Чаще всего для подбора вида уравнения парной регрессии используется графический метод , основанный на построении поля корреляции. Основные типы кривых, используемых при оценке взаимосвязей переменных, представлены на рисунке 1:




а) б) в)

Аналитический метод выбора типа уравнения регрессии состоит в изучении материальной природы взаимосвязи исследуемых факторов и учете степеней их влияния друг на друга в уравнении регрессии.

При использовании экспериментального метода строятся уравнения различных типов, а затем из них выбирается наилучшее с точки зрения величины дисперсии ошибки:

.

Чем меньше величина дисперсии ошибки, тем лучше построенное уравнение регрессии подходит к исходным данным.

Основной целью множественной регрессии является построение модели с большим числом факторов и определение при этом влияния каждого из факторов в отдельности на результат, а так же определение совокупного воздействия факторов на моделированный показатель.

Спецификация модели множественной регрессии включает в себя отбор фактора и выбор вида математической функции (выбор вида уравнения регрессии). Факторы, включаемые во множественную регрессию должны быть количественно измеримы и не должны быть интеркоррелированы и тем более находиться в точной функциональной связи (т.е. должны в меньшей степени влиять друг на друга, а в большей степени на результативный признак).

Включаемые во множественную регрессию факторы должны объяснять вариацию независимой переменной. Например, если строится модель с набором - факторов, то для нее находится значение показателя детерминации , который фиксирует долю объясненной вариации результативного признака за счет - факторов.

Влияние других неучтенных факторов в модели оценивается как соответствующей остаточной дисперсии .

При включении в модель дополнительного фактора значение показателя детерминации должно возрастать, а значение остаточной дисперсии должно уменьшиться. Если этого не происходит, то дополнительный фактор не улучшает модель и практически является лишним, причем введение такого фактора может привести к статистической не значимости параметров регрессии по - критерию Стьюдента.

Отбор факторов для множественной регрессии осуществляется в две стадии:

1. Подбираются факторы, исходя из сущности проблемы.

2. На основе матрицы показателей корреляции определяют статистики для параметров регрессии.

Коэффициенты корреляции между объясняющими переменными , которые еще называют коэффициентами интеркорреляции, позволяют исключить из модели дублирующие факторы.

Две переменные и называют явно коллинеарными, если коэффициент корреляции .

Если переменные явно коллинеарны, то они находятся в сильной линейной зависимости.



При наличии явно коллинеарных переменных предпочтение отдается не фактору более тесно связанному с результатом, а фактору, который при этом имеет наименьшую тесноту связи с другими факторами.

По величине парных коэффициентов корреляции обнаруживается лишь явная коллениарность факторов.

При использовании множественной регрессии может возникнуть мультиколлениарность фактов, т.е. более чем два фактора связаны между собой линейной зависимостью. В таких случаях менее надежным становится МНК при оценке отдельных факторов, результатом чего становится затруднение интерпретации параметров множественной регрессии как характеристик действия фактора в чистом виде. Параметры линейной регрессии теряют экономический смысл, оценки параметров ненадежны, возникают большие стандартные ошибки, которые при этом могут изменяться с изменением объема наблюдений, т.е. модель становится непригодной для анализа и прогнозирования экономической ситуации. Для оценки мультиколлениарности фактора используют следующие методы:

1. Определение матрицы парных коэффициентов корреляции между факторами, например, если задана линейная модель множественной регрессии , то определитель матрицы парных коэффициентов примет вид:

Если значение данного определителя равно 1

,

то факторы являются неколлинеарными между собой.

Если между факторами существует полная линейная зависимость, то все коэффициенты парной корреляции равны 1, в результате чего

.

2. Метод испытания гипотезы о независимости переменных. В этом случае нулевая гипотеза , доказано, что величина имеет приближенное распределение с числом степеней свободы .

Если , то нулевая гипотеза отклоняется.

Определяя и сравнивая между собой коэффициенты множественной детерминации фактора, используя в качестве зависимой переменной последовательно каждой из факторов можно определить факторы, ответственные за мультиколлениарность, т.е. фактор с наибольшим значением величины .

Существуют следующие способы преодоления сильной межфакторной корреляции:

1) исключение из модели одного или несколько данных;

2) преобразование факторов для уменьшения корреляции;

3) совмещение уравнения регрессии, которые будут отражать не только факторы, но и их взаимодействие;

4) переход уравнения приведенной формы и др.

При построении уравнения множественной регрессии одним из важнейших этапов является отбор факторов, включаемых в модель. Различные подходы к отбору факторов на основе показателей корреляции к различным методам, среди которых наиболее применимы:

1) Метод исключения – производится отсев данных;

2) Метод включения – вводят дополнительный фактор;

3) Шаговый регрессионный анализ – исключают ранее введенный фактор.

При отборе факторов применяют следующее правило: число включаемых факторов обычно в 6-7 раз меньше объема совокупности, по которой строится модель.

Параметр не подлежит экономической интерпретации. В степенной модели нелинейное уравнение множественной регрессии коэффициенты , ,…, являются коэффициентами эластичности, которые показывают насколько, в среднем, изменится результат при изменении соответствующего фактора на 1% при неизменном воздействии остальных факторов.

Одним из базовых предположений построения качественной модели является правильная (хорошая) спецификация уравнения регрессии. Правильная спецификация уравнения регрессии означает, что оно в целом верно отражает соотношение между изучаемой переменной и объясняющими факторами, участвующими в модели. Это является необходимой предпосылкой дальнейшего качественного оценивания регрессионной модели.

Неправильный выбор функциональной формы или набора объясняющих переменных называется ошибками спецификации, основными типами которых являются.

  • 1. Отбрасывание значимой переменной. Суть данной ошибки и ее последствия наглядно иллюстрируются следующим примером. Пусть теоретическая модель, отражающая рассматриваемую экономическую зависимость, имеет вид

Данной модели соответствует следующее эмпирическое уравнение регрессии:

Исследователь по каким-то причинам (недостаток информации, поверхностное знание о предмете исследования и т. п.) считает, что на переменную Y реально воздействует лишь переменная Х у Он ограничивается рассмотрением модели

При этом он не рассматривает в качестве объясняющей переменную Х 2 , совершая ошибку отбрасывания существенной переменной.

Пусть эмпирическое уравнение регрессии, соответствующее теоретическому уравнению (9.28), имеет вид

Последствия данной ошибки достаточно серьезны. Оценки, полученные с помощью МНК по уравнению (9.29), являются смещенными (М[у* 0 ] Ф Ь 0 , М[у*] Ф Ъ г) и несостоятельными даже при бесконечно большом числе испытаний. Следовательно, возможные интервальные оценки и результаты проверки соответствующих гипотез будут ненадежными.

Последствия данной ошибки будут не столь серьезными, как в предыдущем случае. Оценки у 0 , коэффициентов, найденные для модели (9.30), остаются, как правило, несмещенными (M = b 0 , М[у* 1 ] = Ъ 1) и состоятельными. Однако их точность уменьшится, увеличивая при этом стандартные ошибки, т. е. оценки становятся неэффективными, что отразится на их устойчивости. Данный вывод логически вытекает из расчета дисперсий оценок коэффициентов регрессии для этих уравнений:

Здесь r XiX2 - коэффициент корреляции между объясняющими переменными Х 1 иХ 2 .

Следовательно, причем знак равенства возможен

лишь при

Увеличение дисперсии оценок может привести к ошибочным результатам проверки гипотез относительно значений коэффициентов регрессии, расширению интервальных оценок.

3. Выбор неправильной функциональной формы. Суть ошибки проиллюстрируем следующим примером. Пусть правильная регрессионная модель имеет вид

Любая другая зависимость с теми же переменными, но имеющая другой функциональный вид, приводит к искажению истинной зависимости. Например, в следующих уравнениях

совершена ошибка выбора неправильной функциональной формы уравнения регрессии. Последствия данной ошибки будут весьма серьезными. Обычно такая ошибка приводит либо к получению смещенных оценок, либо к ухудшению статистических свойств оценок коэффициентов регрессии и других показателей качества уравнения. В первую очередь это вызвано нарушением условий Гаусса-Маркова для отклонений. Прогнозные качества модели в этом случае очень низки.

При построении уравнений регрессии, особенно на начальных этапах, ошибки спецификации допускаются довольно часто из-за поверхностных знаний об исследуемых экономических процессах, или из-за недостаточно глубоко проработанной теории, или из-за погрешностей сбора и обработки статистических данных при построении эмпирического уравнения регрессии. Важно уметь обнаружить и исправить эти ошибки. Сложность процедуры обнаружения определяется типом ошибки и нашими знаниями об исследуемом объекте.

Если в уравнении регрессии имеется одна несущественная переменная, то она обнаружит себя по низкой t-статистике. В дальнейшем эту переменную исключают из рассмотрения.

Если в уравнении несколько статистически незначимых объясняющих переменных, то следует построить другое уравнение регрессии без этих незначимых переменных. Затем с помощью F-статистики сравниваются коэффициенты детерминации для первоначального и дополнительного уравнений регрессий

где п -- число наблюдений;

га - число объясняющих переменных в первоначальном уравнении;

к -- число отбрасываемых из первоначального уравнения объясняющих переменных.

Возможные рассуждения и выводы для данной ситуации приведены в п. 6.7.2.

Однако проведение указанных проверок имеет смысл лишь при правильном подборе вида (функциональной формы) уравнения регрессии, что можно осуществить, если согласовывать его с теорией. Например, при построении кривой Филлипса, устанавливающей зависимость между заработной платой У и безработицей X, является обратной. Возможны следующие модели:

Отметим, что выбор модели далеко не всегда осуществляется однозначно и в дальнейшем требуется сравнивать модель как с теоретическими, так и с эмпирическими данными, и совершенствовать ее. Напомним, что при определении качества модели обычно анализируются следующие параметры:

  • а) скорректированный коэффициент детерминации Я;
  • б) t-статистики;
  • в) статистика Дарбина-Уотсона DW;
  • г) согласованность знаков коэффициентов с теорией;
  • д) прогнозные качества (ошибки) модели.

Если все эти показатели удовлетворительны, то данная модель может быть предложена для описания исследуемого реального процесса. Если же какая-либо из описанных выше характеристик не является удовлетворительной, т. е. основания сомневаться в качестве данной модели (неправильно выбрана функциональная форма уравнения; не учтена важная объясняющая переменная; имеется объясняющая переменная, неоказывающая значимого влияния на зависимую переменную).

  • Добавление незначимой переменной. В некоторых случаях в уравнения регрессии включают слишком много объясняющих переменных, причем не всегда обоснованно. Например,теоретическая модель имеет следующий вид Пусть исследователь подменяет ее более сложной моделью: добавляя при этом не оказывающую реального воздействия наY объясняющую переменную Х2. В этом случае совершаетсяошибка добавления несущественной переменной.

Шпоры по эконометрике.

№ 1. СПЕЦИФИКАЦИЯ МОДЕЛИ

Простая регрессия представляет собой регрессию между двумя переменными -у и х, т.е. модель вида , где у - результативный признак; х - признак-фактор.

Множественная регрессия представляет собой регрессию результативного признака с двумя и большим числом факторов, т. е. модель вида

Специ­фикация модели - формулировка вида модели, исходя из со­ответствующей теории связи между переменными. В урав­нении регрессии корреляционная по сути связь признаков представляется в виде функциональной связи, выраженной соответствующей математической функцией. где y j - фактическое значение результативного признака;

y xj -теоретическое значение результативного признака.

- случайная величина, характеризующая отклонения реального значения результативного признака от теоретического.

Случайная величина ε называется также возмущением. Она включает влияние не учтенных в модели факторов, случайных ошибок и особенностей измерения.

От правильно выбранной спецификации модели за­висит величина случайных ошибок: они тем меньше, чем в боль­шей мере теоретические значения результативного признака подходят к фактическим данным у.

К ошибкам спецификации относятся непра­вильный выбор той или иной математической функции для, и недоучет в уравнении регрессии какого-либо существенного фактора, т. е. использование парной регрессии вместо множест­венной.

Ошиб­ки выборки - исследователь чаще всего имеет дело с выборочными данными при установлении закономерной связи между признаками.

Ошибки измерения практически сводят на нет все усилия по количественной оценке связи между признаками. Основное внимание в эконометрических исследованиях уделяется ошибкам спецификации модели.

В парной регрессии выбор вида математической функции может быть осуществлен тремя методами: графическим, аналитическим и экспериментальным.

Графи­ческий метод основан на поле корреляции. Аналитический метод основан на изучении материальной природы связи исследуемых признаков.

Экспериментальный метод осуществляется путем сравнения величины остаточной дисперсии D ост, рассчитанной при разных моделях. Если фактические значения результативного признака совпадают с теоретическими у =, то D ocm =0. Если имеют место отклонения фактических данных от теоретических (у - ) то .

Чем меньше величина остаточной дисперсии, тем лучше уравнение регрессии подходит к исходным данным. Число наблюдений должно в 6 - 7 раз превышать число рассчитывае­мых параметров при переменной х.

№ 2 ЛИНЕЙНАЯ РЕГРЕССИЯ И КОРРЕЛЯЦИЯ: СМЫСЛ И ОЦЕНКА ПАРАМЕТРОВ.

Линейная регрессия сводится к нахождению уравнения вида или .

Уравнение вида позволяет по заданным значениям фактора x иметь теоретические значения результативного признака, подставляя в него фактические значения фактора х.

Построение линейной регрессии сводится к оценке ее пара­метров а и в.

Оценки параметров линейной регрессии могут быть найдены разными методами.

1.

2.

Параметр b называется коэффициентом регрессии. Его вели­чина показывает среднее изменение результата с изменением фактора на одну единицу.

Формально а - значение у при х = 0. Если признак-фактор
не имеет и не может иметь нулевого значения, то вышеуказанная
трактовка свободного члена, а не имеет смысла. Параметр, а может
не иметь экономического содержания. Попытки экономически
интерпретировать параметр, а могут привести к абсурду, особенно при а < 0.

Интерпретировать можно лишь знак при параметре а. Если а > 0, то относительное изменение результата происходит медленнее, чем изменение фактора.

Уравнение регрессии всегда дополняется показателем тесноты связи. При использовании линейной регрессии в качестве такого показателя выступает линейный коэффициент корреляции r xy . Существуют разные модификации формулы линейного коэф­фициента корреляции.

Линейный коэффициент корреляции находится и границах: -1≤. r xy ≤ 1. При этом чем ближе r к 0 тем слабее корреляция и наоборот чем ближе r к 1 или -1, тем сильнее корреляция, т.е. зависимость х и у близка к линейной. Если r в точности =1или -1 все точки лежат на одной прямой. Если коэф. регрессии b>0 то 0 ≤.r xy ≤ 1 и наоборот при b<0 -1≤.r xy ≤0. Коэф. корреляции отражает степени линейной зависимости м/у величинами при наличии ярко выраженной зависимости др. вида.

Для оценки качества подбора линейной функции рассчитывается квадрат линейного коэффициента корреляции , называемый коэффициентом детерминации. Коэффициент детермина­ции характеризует долю дисперсии результативного признака y, объясняемую регрессией. Соответствующая величина характеризует долю дисперсии у, вызванную влиянием остальных не учтенных в модели факторов.

№ 3. МНК.

МНК позволяет получить такие оценки параметров а и b , которых сумма квадратов отклонений фактических значений ре­зультативного признака (у) от расчетных (теоретических) ми­нимальна:

Иными словами, из всего множества линий линия регрессии на графике выбирается так, чтобы сумма квадратов расстояний по вертикали между точками и этой линией была бы минималь­ной. Решается система нормальных уравнений

№ 4. ОЦЕНКА СУЩЕСТВЕННОСТИ ПАРАМЕТРОВ ЛИНЕЙНОЙ РЕГРЕССИИ И КОРРЕЛЯЦИИ .

Оценка значимости уравнения регрессии в целом дается с по­мощью F-критерия Фишера. При этом выдвигается нулевая ги­потеза, что коэффициент регрессии равен нулю, т. е. b = 0, и следовательно, фактор х не оказывает влияния на результат у.

Непосредственному расчету F-критерия предшествует анализ дисперсии. Центральное место в нем занимает разложе­ние общей суммы квадратов отклонений переменной у от средне го значения у на две части - «объясненную» и «необъясненную»:

Общая сумма квадратов отклонений

Сумма квадратов отклонения объясненная регрессией - остаточная сумма квадратов отклонения.

, т. е. с числом свободы независимого варьирования признака. Число степеней свободы связано с числом единиц совокупности nис числом определяемых по ней констант. Применительно к исследуемой проблеме число cтепеней свободы должно показать, сколько независимых откло­нений из п

Дисперсия на одну степень свободы D .

F-отношения (F-критерий):

Ecли нулевая гипотеза справедлива, то факторная и остаточная дисперсии не отличаются друг от друга. Для Н 0 необходимо опровержение, чтобы факторная дисперсия превышала остаточную в несколько раз. Английским статистиком Снедекором раз­работаны таблицы критических значений F-отношений при разных уровнях существенности нулевой гипотезы и различном числе степеней свободы. Табличное значение F-критерия - это максимальная величина отношения дисперсий, которая может иметь место при случайном их расхождении для данного уровня вероятности наличия нулевой гипотезы. Вычисленное значение F-отношения признается достоверным, если о больше табличного. В этом случае нулевая гипотеза об отсутствии связи признаков отклоняется и делается вывод о существенности этой связи: F факт > F табл Н 0 отклоняется.

Если же величина окажется меньше табличной F факт ‹, F табл, то вероятность нулевой гипотезы выше заданного уровня и она не может быть отклонена без серьезного риска сделать неправильный вывод о наличии связи. В этом случае уравнение регрессии считается статистически незначимым. Н о не отклоняется.

Стандартная ошибка коэффициента регрессии

Для оценки существенности коэффициента регрессии его ве­личина сравнивается с его стандартной ошибкой, т. е. определяется фактическое значение t-критерия Стьюдентa: которое

затем сравнивается с табличным значением при определенном уровне значимости и числе степеней свободы (n- 2).

Стандартная ошибка параметра а :

Значимость линейного коэффициента корреляции проверя­ется на основе величины ошибки коэффициента корреляции т r :

Общая дисперсия признака х:

Коэф. регрессии Его величина показывает ср. изменение результата с изменением фактора на 1 ед.

Ошибка аппроксимации:

№ 5. ИНТЕРВАЛЫ ПРОГНОЗА ПО ЛИНЕЙНОМУ УРАВНЕНИЮ

РЕГРЕССИИ

Оценка стат. значимости параметров регрессии проводится с помощью t – статистики Стьюдента и путем расчета доверительного интервала для каждого из показателей. Выдвигается гипотеза Н 0 о статистически значимом отличие показателей от 0 a = b = r = 0. Рассчитываются стандартные ошибки параметров a,b, r и фактич. знач. t – критерия Стьюдента.

Определяется стат. значимость параметров.

t a ›T табл - a стат. значим

t b ›T табл - b стат. значим

Находятся границы доверительных интервалов.

Анализ верхней и нижней границ доверительных интервалов приводит к выводу о том, что параметры a и b находясь в указанных границах не принимают нулевых значений, т.е. не явл.. стат. незначимыми и существенно отличается от 0.

№ 6. НЕЛИНЕЙНАЯ РЕГРЕССИЯ. ВИДЫ МОДЕЛЕЙ

Если между экономическими явлениями существуют нели­нейные соотношения, то они выражаются с помощью соответ­ствующих нелинейных функций: например, равносторонней ги­перболы , параболы второй степени и д.р.

Различают два класса нелинейных регрессий:

регрессии, нелинейные относительно включенных в анализ объясняющих переменных, но линейные по оцениваемым па­раметрам;

Регрессии, нелинейные по оцениваемым параметрам.
Примером нелинейной регрессии по включаемым в нее объ­ясняющим переменным могут служить следующие функции:

Полиномы разных степеней

Равносторонняя гипербола

К нелинейным регрессиям по оцениваемым параметрам от­носятся функции:

Степенная

Показательная

Экспоненциальная

№ 7. СМЫСЛ КОЭФФИЦИЕНТА РЕГРЕССИИ.

Параметр b называется коэффициентом регрессии. Его вели­чина показывает среднее изменение результата с изменением фактора на одну единицу. Оценку коэффициента регрессии можно получить не обращаясь к методу наименьших квадратов. Альтернативную оценку параметра b можно найти исходя из содержания данного коэффициента: изменение результата сопоставляют с изменением фактора

Общая сумма квадратов отклонений индивидуальных значений результативного признака у от среднего значения вызвана влиянием множества причин. Условно разделим всю совокупность причин на две группы: изучаемый фактор х и прочие факторы.

Если фактор не оказывает влияния на результат, то линия регрес­сии на графике параллельна оси ох и .Тогда вся дисперсия результативного признака обусловлена воздействием прочих факторов и общая сумма квадратов отклонений совпадет с остаточной. Если же прочие факторы не влияют на результат, то у связан с х функционально и остаточная сумма квадратов равна нулю. В этом случае сумма квадратов отклонений, объясненная регрессией, совпадает с общей суммой квадратов.

Поскольку не все точки поля корреляции лежат на линии регрессии, то всегда имеет место их разброс как обусловленный вли­янием фактора х, т. е. регрессией у по х, так и вызванный действием прочих причин (необъясненная вариация). Пригод­ность линии регрессии для прогноза зависит от того, какая часть общей вариации признака у приходится на объясненную вариа­цию

Очевидно, что если сумма квадратов отклонений, обусловленная регрессией, будет больше остаточной суммы квадратов, то уравнение регрессии статистически значимо и фактор х оказывает существенное воздействие на результат у

Любая сумма квадратов отклонений связана с числом степе­ней свободы , т. е. с числом свободы независимого варьирования признака. Число степеней свободы связано с числом единиц совокупности n ис числом определяемых по ней констант. Применительно к исследуемой проблеме число степеней свободы должно показать, сколько независимых откло­нений из п возможных требуется для образования данной суммы квадратов.

№8. ПРИМЕНЕНИЕ МНК К МОДЕЛЯМ НЕЛИНЕЙНЫМ ОТНОСИТЕЛЬНО ВКЛЮЧАЕМЫХ ПЕРЕМЕННЫХ И ОЦЕНИВАЕМЫХ ПАРАМЕТРОВ.

Нелинейная регрессия по включенным переменным не таит каких-либо сложностей в оценке ее параметров. Она определяет­ся, как и в линейной регрессии, методом наименьших квадратов (МНК), ибо эти функции линейны по параметрам. Так, в парабо­ле второй степени y=a 0 +a 1 x+a 2 x 2 +ε заменяя переменные x=x 1 ,x 2 =x 2 , получим двухфакторное урав­нение линейной регрессии: у=а 0 +а 1 х 1 +а 2 х 2 + ε

Парабола второй степени целесообразна к применению, если для определенного интервала значений фактора меняется харак­тер связи рассматриваемых признаков: прямая связь меняется на обратную или обратная на прямую. В этом случае определяется значение фактора, при котором достигается максимальное (или минимальное), значение результативного признака: приравнива­ем к нулю первую производную параболы второй степени: , т.е. b+2cx=0 и x=-b/2c

Применение МНК для оценки параметров параболы второй степени приводит к следующей системе нормальных уравнений:

Решение ее возможно методом определителей:

В моделях, нелинейных по оцениваемым параметрам, но приводимых к линейному виду, МНК применяется к преобразо­ванным уравнениям. Если в линейной модели и моделях, нели­нейных по переменным, при оценке параметров исходят из кри­терия min, то в моделях, нелинейных по оцениваемым параметрам, требование МНК применяется не к исходным дан­ным результативного признака, а к их преобразованным величи­нам, т. е.ln y, 1/y. Так, в степенной функции МНК применяется к преобразованному уравнению lny = lnα + β ln x ln ε. Это значит, что оценка параметров основывается на миними­зации суммы квадратов отклонений в логарифмах. Соответственно если в линейных моделях то в моделях, нелинейных по оцениваемым параметрам, . Вследствие этого оценка параметров оказываются несколько смещенной.

№9. КОЭФФИЦИЕНТЫ ЭЛАСТИЧНОСТИ ПО РАЗНЫМ ВИДАМ РЕГРЕССИОННЫХ МОДЕЛЕЙ.

1. Линейная y = a + bx + , y′ = b, Э = .

2. Парабола 2 порядка y = a +bx + c +, y′ = b + 2cx, Э = .

3. Гипербола y = a+b/x +, y′=-b/, Э = .

4. Показательная y=a, y′ = ln , Э = x ln b.

5. Степенная y = a, y′ = , Э = b.

6. Полулогарифмическая y = a + b ln x +ε , y′ = b/x , Э = .

7. Логистическая , y′ = , Э = .

8. Обратная y = , y′ = , Э = .

№ 10 ПОКАЗАТЕЛИ КОРРЕЛЯЦИИ

Величина данного показателя находится в границах: 0 ≤ R 1, чем ближе к 1, тем теснее связь рассматриваемых призна­ков, тем более надежно найденное уравнение регрессии.

2. индекс детерминации используется для проверки существенности в целом ур-ия нелинейной регрессии по F- критерию Фишера:

№11. МНОЖЕСТВЕННАЯ РЕГРЕССИЯ. СПЕЦИФИКАЦИЯ МОДЕЛИ. ОТБОР ФАКТОРОВ ПРИ ПОСТРОЕНИИИ МОДЕЛИ.

Регрессия может дать хороший результат при модели­ровании, если влиянием других факторов, воздействующих на объект исследования, можно пренебречь. Поведение отдельных экономи­ческих переменных контролировать нельзя, т. е. не удается обес­печить равенство всех прочих условий для оценки влияния одно­го исследуемого фактора. В этом случае следует попытаться выявить влияние других факторов, введя их в модель, т. е. пост­роить уравнение множественной регрессии: y = a + b 1 x 1 + b 2 +…+ b p x p + e ; Такого рода уравнение может использоваться при изучении потребления. Тогда коэффициенты bj - частные производные потребления у по соответствующим факторам x i : , в предположении, что все остальные х i постоянны. В 30-е гг. XX в. Кейнс сформулировал свою гипотезу потребительской функции. С того времени исследователи неод­нократно обращались к проблеме ее совершенствования. Совре­менная потребительская функция чаще всего рассматривается как модель вида: C = j ( y , P , M , Z ), где С - потребление; у - доход; Р - цена, индекс стоимости жизни; М - наличные деньги; Z - ликвидные активы. При этом .. Основная цель множественной регрессии - построить модель с большим числом факторов, определив при этом влияние каждого из них в отдельности, а также совокупное их воздействие на моделируемый показатель. Спецификация модели включает в себя два круга вопросов: отбор фак­торов и выбор вида уравнения регрессии. Требования к факторам.1 Они должны быть количественно измеримы. Если необхо­димо включить в модель качественный фактор, не имеющий ко­личественного измерения, то ему нужно придать количествен­ную определенность (например, в модели урожайности качество почвы задается в виде баллов) 2.Факторы не должны быть интеркоррелированы и тем более находиться в точной функциональной связи. Включение в модель факторов с высокой интеркорреляцией, когда R yx 1 R x 1 x 2 .Для зависимости y = a + b 1 x 1 + b 2 +…+ b p x p + e может привести к нежелательным последствиям, повлечь за собой неустойчивость и ненадежность оценок коэффициентов регрессии. Если между факторами существует высокая корреляция, то нельзя определить их изолированное влияние на результативный показатель и параметры уравнения регрессии оказываются не интерпретированными.

Включаемые во множественную регрессию факторы должны объяснить вариацию независимой переменной. Если строится модель с набором р- факторов, то для нее рассчитывается показа­тель детерминации R 2 , который фиксирует долю объясненной ва­риации результативного признака за счет рассматриваемых в ре­грессии р- факторов. Влияние других не учтенных в модели фак­торов оценивается как 1 - R 2 с соответствующей остаточной дис­персией S 2 . При дополнительном включении в регрессию (р + 1) фактора коэффициент детерминации должен возрастать, а остаточная дисперсия уменьшаться:. Насыщение модели лишними факторами не только не снижа­ет величину остаточной дисперсии и не увеличивает показатель детерминации, но и приводит к статистической незначимости параметров регрессии по t-критерию Стьюдента.

Таким образом, хотя теоретически регрессионная модель позволяет учесть любое число факторов, практически в этом нет необходимости. Отбор факторов производится на основе качест­венного теоретико-экономического анализа, который обычно осуществляется в две стадии: на первой подби­раются факторы исходя из сущности проблемы; на второй – на основе показателей корреляции определяют t-статистики для параметров регрессии. Коэффициенты интеркорреляции (т. е. корреляции между объясняющими переменными) позволяют исключать из модели дублирующие факторы. Считается, что две переменных явно кол линеарны, т. е. находятся между собой в линейной зависимости, если . Ес­ли факторы явно коллинеарны, то они дублируют друг друга и один из них рекомендуется исключить из регрессии. Предпочте­ние при этом отдается не фактору, более тесно связанному с результатом, а тому фактору, который при достаточно тесной связи с результатом имеет наименьшую тесноту связи с другими факторами. В этом требовании проявляется специфика множест­венной регрессии как метода исследования комплексного воз­действия факторов в условиях их независимости друг от друга. Наибольшие труд­ности в использовании аппарата множественной регрессии воз­никают при наличии мультиколлинеарности факторов, когда более чем два фактора связаны между собой линейной зависимос­тью. Наличие мультиколлинеарности факторов может озна­чать, что некоторые факторы будут всегда действовать в унисон. В результате вариация в исходных данных перестает быть полно­стью независимой, и нельзя оценить воздействие каждого факто­ра в отдельности. Чем сильнее мультиколлинеарность факторов, тем менее надежна оценка распределения суммы объясненной вариации по отдельным факторам с помощью метода наименьших квадратов (МНК). Включение в модель мультиколлинеарных факторов нежела­тельно в силу следующих последствий: 1.затрудняется интерпретация параметров множественной ре­грессии как характеристик действия факторов в «чистом» ви­де, ибо факторы коррелированы; параметры линейной регрессии теряют экономический смысл;2оценки параметров ненадежны, обнаруживают большие стан­дартные ошибки и меняются с изменением объема наблюде­ний. Для оценки мультиколлинеарности факторов может исполь­зоваться определитель матрицы парных коэффициентов корреля­ ции между факторами.

Если бы факторы не коррелировали между собой, то матрица парных коэффициентов корреляции между факторами была бы единичной матрицей. Для включающего три объ­ясняющих переменных уравнения: y = a + b 1 x 1 + b 2 + b 3 x 3 + e . Матрица коэф-в корреляции м/у факторами имела бы определитель равный 1. Det =1, т.к. r x 1 x 1 =r x 2 x 2 =1 и r x 1 x 2 =r x 1 x 3 =r x 2 x 3 =0. Если м/у факторами сущ-ет полная линейная зависимость и все коэф-ты корреляции =1, то определитель такой матрицы =0. Чем ближе к нулю определитель матрицы межфакторной корреляции, тем сильнее мультиколлинеарность факторов и ненадежнее результаты множественной регрессии. И, наоборот, чем ближе к единице определитель матрицы межфакторной кор­реляции, тем меньше мультиколлинеарность факторов.

№12. ЧТО ОЗНОЧАЕТ ВЗАИМОДЕЙСТВИЕ ФАКТОРОВ И КАК ОНО МОЖЕТ БЫТЬ ПРЕДСТАВЛЕНО ГРАФИЧЕСКИ?

Одним из путей учета внутренней корреляции факторов является переход к совмещенным уравнениям регрессии, т. е. к уравнениям, которые отражают не только влияние факторов, но и их взаимодействие. Так, если y=f(x1,x2,x3), то возможно пост­роение следующего совмещенного уравнения: y = a + b 1 x 1 + b 2 x 2 + b 3 x 3 + b 12 x 1 x 2 + b 13 x 1 x 3 + b 23 x 2 x 3 + e . Рассматриваемое уравнение включает взаимодействие перво­го порядка (взаимодействие двух факторов). Возможно включе­ние в модель и взаимодействий более высокого порядка, если будет доказана их статистическая значимость по F-критерию Фи­шера. Если анализ совмещенного уравнения показал значи­мость только взаимодействия факторов х 1 и х 3 ,то уравнение бу­дет иметь вид: y = a + b 1 x 1 + b 2 x 2 + b 3 x 3 + b 13 x 1 x 3 + e . Взаимодействие факторов х 1 и х 3 означает, что на разных уровнях фактора х 3 влияние фактора х 1 на у будет неодинаково, т. е. оно зависит от значений фактора х 3 . На рис. взаимодейст­вие факторов представляется непараллельными линиями связи с результатом у. И, наоборот, параллельные линии влияния факто­ра x 1 на у при разных уровнях фактора х 3 означают отсутствие вза­имодействия факторов х 1 и х 3 . Графики:

а - х 1 влияет на у, причем это влияние одинаково как при х 3 =В 1 , так и при х 3 =В 2 (одинаковый наклон линий регрессии), что означает отсутствие взаи­модействия факторов х 1 и х 3 ; б - с ростом х 1 результативный признак y возрастает при х 3 = В 1 ; с ростом х 1 результативный признак у снижается при х 3 = В 2 .. Между х 1 и х 3 существу­ет взаимодей-вие. Совмещенные уравнения регрессии строятся, например, при исследовании эффекта влияния на урожайность разных видов удобрений.Решению проблемы устранения мультиколлинеарности фак­торов может помочь и переход к уравнениям приведенной фор­мы. С этой целью в уравнение регрессии производится подста­новка рассматриваемого фактора через выражение его из другого уравнения.

№13. ИНТЕРПРИТАЦИЯ КОЭФФИЦИЕНТОВ РЕГРЕССИИ ЛИНЕЙНОЙ МОДЕЛИ ПОТРЕБЛЕНИЯ. СМЫСЛ СУММЫ b i В ПРОИЗВОДСТВЕННЫХ ФУНКЦИЯХ И ЗНАЧЕНИЕ СУММЫ b i >1 . КОЭФФИЦИЕНТЫ, ИСПОЛЬЗУЕМЫЕ ДЛЯ ОЦЕНКИ СРАВНИТЕЛЬНОЙ СИЛЫ ВОЗДЕЙСТВИЯ ФАКТОРОВ НА РЕЗУЛЬТАТ.

Функция потребления: С=К*у+L, где С-потребление, у-доход, К и L-параметры функции.(у=С+I, I-размер инвистиций). Предположим, что функция потребления составила:С= 1,9 + 0,65 *у. Коэффициент регрессии характеризует склонность к потреблению. Он показывает, что из каждой тысячи дохода на потреб­ление расходуется в среднем 650 руб., а 350 руб. инвестируются. В производственных функциях:

где Р - количество продукта, изготавливаемого с помощью т производст­венных факторов (F 1 , F 2 ,..., F m ); b - параметр, являющийся эластичностью количества продукции по отношению к количеству соответствующих производственных факторов.

Экономический смысл имеют не только коэффициенты b каждого фактора, но и их сумма, т. е. сумма эластичностей: В= b 1 + b 2 +...+ Ь т. Эта величина фиксирует обобщенную харак­теристику эластичности производства.

При практических расчетах не всегда .Она может быть как больше, так и меньше единицы. В этом случае величина В фиксирует приближенную оценку эластичности выпуска с рос­том каждого фактора производства на 1 % в условиях увеличива­ющейся > 1) или уменьшающейся < 1) отдачи на масштаб. Так, если Р = 2,4* F * F 2 0,7 * F 3 0,2 , то с ростом значений каж­дого фактора производства на 1 % выпуск продукции в целом возрастает приблизительно на 1,2 %.

№14. НАЗНАЧЕНИЕ ЧАСТНОЙ КОРРЕЛЯЦИИ ПРИ ПОСТРОЕНИИ МОДЕЛИ МНОЖЕСТВЕННОЙ РЕГРЕССИИ. Ранжирование факторов, участву­ющих во множественной линейной регрессии, может быть прове­дено через стандартизованные коэффициенты регрессии, с помо­щью частных коэффициентов корреляции - для линейных связей. При нелинейной взаимосвязи исследуемых признаков эту функцию выполняют частные индексы детерминации. Кроме того, частные показатели корреляции широко используются при решении проблемы отбора факторов: целесообразность включе­ния того или иного фактора в модель доказывается величиной показателя частной корреляции.

Частные коэффициенты (или индексы) корреляции характери­зуют тесноту связи между результатом и соответствующим фак­тором при устранении влияния других факторов, включенных в уравнение регрессии.

Показатели частной корреляции представляют собой отно­шение сокращения остаточной дисперсии за счет дополнитель­ного включения в анализ нового фактора к остаточной диспер­сии, имевшей место до введения его в модель.

Частные коэффициенты корреляции измеряющие влияние на у фактора х i при неизменном уровне др. факторов можно определить по формуле:

При двух факторах и i=1 данная формула примет вид:

Частные коэффициенты корреляции изменяются в пределах от -1 до 1.

№15. ЧАСТНЫЙ F -КРИТЕРИЙ, ЕГО ОТЛИЧИЕ ОТ ПОСЛЕДОВАТЕЛЬНОГО F -КРИТЕРИЯ, СВЯЗЬ МЕЖДУ СОБОЙ t - КРИТЕРИЯ СТЬЮДЕНТА ДЛЯ ОЦЕНКИ ЗНАЧИМОСТИ b i И ЧАСТНЫМ F -КРИТЕРИЕМ .

Ввиду корреляции м/у факторами значимость одного и того же фактора м/б различной в зависимости от последовательности его введения в модель. Мерой для оценки включения фактора в модель служит частый F-критерий, т.е. F xi . В общем виде для фактора x i частый F-критерий определяется как:

Если рас­сматривается уравнение y = a + b 1 x 1 + b 2 + b 3 x 3 + e , то определяются последовательно F-критерий для уравнения с од­ним фактором х 1 , далее F-критерий для дополнительного включе­ния в модель фактора х 2 , т. е. для перехода от однофакторного уравнения регрессии к двухфакторному, и, наконец, F-критерий для дополнительного включения в модель фактора х 3 , т. е. дается оценка значимости фактора х 3 после включения в модель факто­ров x 1 их 2 . В этом случае F-критерий для дополнительного вклю­чения фактора х 2 после х 1 является последовательным в отличие от F-критерия для дополнительного включения в модель фактора х 3 , который является частным F-критерием, ибо оценивает значи­мость фактора в предположении, что он включен в модель по­следним. С t-критерием Стьюдента связан именно частный F-критерий. Последовательный F-критерий может интересовать исследователя на стадии формирования модели. Для уравнения y = a + b 1 x 1 + b 2 + b 3 x 3 + e оценка значимости коэффициентов регрессии Ь 1 ,Ь 2, b 3 предпола­гает расчет трех межфакторных коэффициентов детерминации, а именно: ,, и можно убедиться, что существует связь между собой t- критерия Стьюдента для оценки значимости b i и частным F-критерием:

На основе соотношения b i и получим:

№16 ПРЕДПОСЫЛКИ МНК.

При оценке параметров уравнения регрессии применяется МНК. При этом делаются определенные предпосылки относительно составляющей , которая представляет собой ненаблюдаемую величину.

Исследования остатков - предполагают проверку наличия сле­дующих пяти предпосылок МНК: 1.случайный характер остатков; 2.нулевая средняя величина остатков, не зависящая от х i ;

3.гомоскедастичность -дисперсия каждого отклонения ,одинакова для всех значений х; 4.отсутствие автокорреляции остатков. Значения остатков , распределены независимо друг от друга; 5.остатки подчиняются нормальному распределению.

1. Проверяется случайный характер остатков , с этой целью строится график зависимости остатков от теоретических значений результативного признака. Если на графике получена горизонтальная полоса, то остатки , представляют собой случайные величины и МНК оправдан, те­оретические значения у х хорошо аппроксимируют фактические значения y. В других случаях необходимо либо применять дру­гую функцию, либо вводить дополнительную информацию и за­ново строить уравнение регрессии до тех пор, пока остатки , не будут случайными величинами.

2. Вторая предпосылка МНК относительно нулевой средней ве­личины остатков означает, что (у - у х) = 0. Это выполнимо для линейных моделей и моделей, нелинейных относительно вклю­чаемых переменных. С этой целью наряду с изложенным графиком зависимости остатков от теоретических значений ре­зультативного признака у х строится график зависимости случай­ных остатков от факторов, включенных в регрессию х i . Если остатки на графике расположены в виде горизонтальной полосы, то они независимы от значений x j . Если же график показывает наличие зависимости и х j то модель неадек­ватна. Причины неадекватности могут быть разные.

3. В соответствии с третьей предпосылкой МНК требуется, что­бы дисперсия остатков была гомоскедастичной. Это значит, что для каждого значения фактора x j остатки , имеют одинаковую дисперсию. Если это условие применения МНК не соблюдается, то имеет место гетероскедастичность. Наличие гетероскедастичности можно наглядно видеть из поля корреляции. Гомоскедастичность остатков означает, что дисперсия остат­ков - одинакова для каждого значения х .

4.Отсутствие автокор­реляции остатков, т. е. значения остатков распределены неза­висимо друг от друга. Автокорреляция остатков означает наличие корреляции между остатками текущих и предыдущих (последующих) наблюдений. Отсутствие автокорреляции остаточных величин обеспечива­ет состоятельность и эффективность оценок коэффициентов ре­грессии.

№17. СУЩНОСТЬ АНАЛИЗА ОСТАТКОВ ПРИ НАЛИЧИИ РЕГРЕССИОННОЙ МОДЕЛИ. КАК МОЖНО ПРОВЕРИТЬ НАЛИЧИЕ ГОМО- ИЛИ ГЕТЕРОСКЕДАСТИЧНОСТИ ОСТАТКОВ. ОЦЕНКА ОТСУТСТВИЯ АВТОКОРРЕЛЯЦИИ ОСТАТКОВ ПРИ ПОСТРОЕНИИ СТАТИСТИЧЕСКОЙ РЕГРЕССИОННОЙ МОДЕЛИ.

С этой целью строиться график зависимости остатков e i от теоретических значений результативного признака:

Если на графике получена горизонтальная полоса, то остатки e i представляют собой случайные величины и МНК оправдан, те­оретические значения у х хорошо аппроксимируют фактические значения у.

Возможны следующие случаи: если e i зависит от у x , то: 1.остатки e i не случайны.2. остатки e i , не имеют постоянной дисперсии. 3. Остатки e i носят систематический характер в дан­ном случае отрицательные значения e i , соответствуют низким значениям у х, а положительные - высоким значениям. В этих случаях необходимо либо применять дру­гую функцию, либо вводить дополнительную информацию.

Как можно проверить наличие гомо- или гетероскедастичноси остатков? Гомоскедастичность остатков означает, что дисперсия остатков e i одинакова для каждого значения х. Если это условие применения МНК не соблюдается, то имеет место гетероскедастичность. Наличие гетероскедастичности можно наглядно видеть из поля корреляции. а - дисперсия остатков растет по мере увеличения х; б - дисперсия остатков достигает максимальной величины при средних значениях переменной х и уменьшается при минимальных и максимальных значениях х; в - максимальная дисперсия остатков при

малых значениях х и дисперсия остатков однородна по мере увеличения значений х. Графики гомо- и гетеро-ти.

Оценка отсутствия автокорреляции остатков (т.е. значения остатков e i распределены независимо друг от друга). Автокорреляция остатков означает наличие корреляции между остатками текущих и предыдущих (последующих) наблюдений. Коэффициент корреляции между e i и e j , где e i - остатки текущих наблюдений, e j - остатки предыдущих наблю­дений, может быть определен по обычной формуле линейного коэффициента корреляции . Если этот коэффициент окажется существенно отличным от ну­ля, то остатки автокоррелированы и функция плотности вероят­ности F(e ) зависит j-й точки наблюдения и от распределения значений остатков в других точках наблюдения. Для регрессионных моделей по статической информации ав­токорреляция остатков может быть подсчитана, если наблюдения упорядочены по фактору х . Отсутствие автокорреляции остаточных величин обеспечива­ет состоятельность и эффективность оценок коэффициентов ре­грессии. Особенно актуально соблюдение данной предпосылки МНК при построении регрессионных моделей по рядам динами­ки, где ввиду наличия тенденции последующие уровни динами­ческого ряда, как правило, зависят от своих предыдущих уров­ней.

№18 СМЫСЛ ОБОБЩЕННОГО МНК .

При нарушении гомоскедастичности и наличии автокорреля­ции ошибок рекомендуется традиционный МНК заменять обобщенным методом. Обобщенный МНК применяется к преобразованным данным и позволяет получать оценки, которые обладают не только свойством несмещенности, но и имеют меньшие выборочные дисперсии. Обобщенный МНК для корректировки гетерос-ти. В общем виде для уравнения y i =a+bx i +e i при где K i – коэф-т пропор-ти. Модель примет вид: y i =+x i +e i . В ней остаточные величины гетероскедастичны. Предполагая в них отсутствие автокорреляции, можно перейти к уравнению с гомоскедастичными остатками, поделив все переменные, зафик­сированные в ходе i-го наблюдения на . Тогда дисперсия остатков будет величиной постоянной. От регрессии у по х мы перейдем к регрессии на новых переменных: y / и х/ . Уравнение регрессии примет вид: . По отношению к обычной регрессии уравнение с новыми, преобразованными переменными представляет собой взвешен­ную регрессию, в которой переменные у и х взяты с весами . Коэф-т регрессии b можно определить как Как видим, при использовании обобщенного МНК с целью корректировки гетероскедастичности коэффициент регрессии b представляет собой взвешенную величину по отношению к обычному МНК с весами 1/К.Аналогичный подход возможен не только для уравнения парной, но и для множественной регрессии. Модель примет вид: . Модель с преобразованными переменными составит

Это уравнение не содер-т свобод-го члена, применяя обычный МНК получим: Применение в этом случае обобщенного МНК приводит к то­му, что наблюдения с меньшими значениями преобразованных переменных х/К имеют при определении параметров регрессии относительно больший вес, чем с первоначальными переменны­ми.

№19. СИСТЕМЫ ЭКОНОМЕТРИЧЕСКИХ УРАВНЕНИЙ. ПРОБЛЕМА ИДЕНТИФИКАЦИИ.

Сложные экономические процессы описывают с помощью системы взаимосвязанных уравнений. Различают несколько видов систем уравнений: 1. Система независимых уравнений - когда каждая зависимая переменная у рассматривается как функция одного и того же набора факторов х :

y 1 = a 11 * x 1 + a 12 * x 2 +…+ a 1 m * x m + e 1 Для решения этой системы и нахождения ее параметров

y n =a n1 *x 1 +a n2 *x 2 +…+a nm *x m +e n используется МНК.

2.Система рекурсивных уравнений – когда зависимая переменная у одного уравнения выступает в виде фактора х в другом уравнении:

y 1 =a 11 *x 1 +a 12 *x 2 +…+a 1m *x m +e 1

y 2 =b 21 *y 1 +a 21 *x 1 +a 22 *x 2 +…+a 2m *x m +e 2

y 3 =b 31 *y 1 +b 32 *y 2 +a 31 *x 1 +a 32 *x 2 +…+a 3m *x m +e 3

Для решения этой системы и нахождения ее параметров используется МНК.

3 Система взаимосвязанных уравнений – когда одни и те же зависимые переменные в одних уравнениях входят в левую часть, а в других – в правую.

y 1= b 12 *y 2 +b 13 *y 3 +…+b 1n *y n +a 11 *x 1 +a 12 *x 2 +…+a 1m *x m +e 1

y 2 =b 21 *y 1 +b 23 *y 3 +…+b 2n *y n +a 21 *x 1 +a 22 *x 2 +…+a 2m *x m +e 2

y n =b n1 *y 1 +b n2 *y 2 +…+b nn-1 *y n-1 +a n1 *x 1 +a n2 *x 2 +…+a nm *x m +e n

Такая система уравнений называется структурной формой модели. Эндогенные переменные – взаимосвязанные переменные, которые определяются внутри модели (системы) у. Экзогенные переменные – независимые переменные, которые определяются вне системы х. Предопределенные переменные – экзогенные и лаговые (за предыдущие моменты времени) эндогенные переменные системы. Коэффициенты a и b при переменных – структурные коэффициенты модели. Система линейных функций эндогенных переменных от всех предопределенных переменных системы - приведенная форма модели.

Где - коэффициенты приведенной формы модели.

Необходимое условие идентификации – выполнение счетного правила:

D+1=H –уравнение идентифицируемо;

D+1

D+1>H – уравнение сверхидентифицируемо.

Где Н – число эндогенных переменных в уравнении, D – число предопределенных переменных, отсутствующих в уравнении, но присутствующих в системе.

Достаточное условие идентификации- определитель матрицы, составленной из коэффициентов при переменных, отсутствующих в исследуемом уравнении на равен нулю и ранг этой матрицы не менее эндогенных переменных без единицы. Для решения идентифицируемого уравнения применяется КМНК, для решения сверхидентифицируемых - двухшаговый МНК.

№20 КМНК . Применяется в случае точно идентифицируемой модели. Процедура применения КМНК предполагает выполнение следующих этапов: 1. Составляют приведенную форму модели и определяют численные значения параметров для каждого ее уравнения обычным МНК. 2. путем алгебраических преобразований переходят от приведенной формы к уравнениям структурной формы модели, получая тем самым численные оценки структурных параметров.

№21 ДВУХШАГОВЫЙ МНК. МНК)

Основная идея ДМНК - на основе приведенной формы модели получить для сверхидентифицируемого уравнения теоретические значения эндогенных переменных, содержащихся в правой части уравнения. Далее, подставив их вместо фактических значений, можно применить обычный МНК к структурной форме сверхидентифи­цируемого уравнения. Метод получил название двухшагового МНК, ибо дважды используется МНК: на первом шаге при определении приведенной формы модели и нахождении на ее основе оценок теоретических значений эндогенной переменной

и на втором шаге применительно к структурному сверхидентифицируемому уравнению при опре­делении структурных коэффициентов модели по данным теоре­тических (расчетных) значений эндогенных переменных.

Сверхидентифицируемая структурная модель может быть двух типов:

Все уравнения системы сверхидентифицируемы;

Система содержит наряду со сверхидентифицируемыми точно
идентифицируемые уравнения.

Если все уравнения системы сверхидентифицируемые, то для оценки структурных коэффициентов каждого уравнения исполь­зуется ДМНК. Если в системе есть точно идентифицируемые уравнения, то структурные коэффициенты по ним находятся из системы приведенных уравнений.

Применим ДМНК к простейшей сверхидентифицируемой

Данная модель может быть получена из предыдущей иденти­фицируемой модели:

если наложить ограничения на ее параметры, а именно: b 12 =a 11

В результате первое уравнение стало сверхидентифицируемым: Н= 1 (у 1),

D = 1(х 2) и D +1 > Н. Второе уравнение не изме­нилось и является точно идентифицируемым: Н = 2 и D =1

На первом шаге найдем приведенную форму модели, а

ДМНК является наиболее общим и широко распространен­ным методом решения системы одновременных уравнений.

Несмотря на важность системы эконометрических уравнений, на практике часто не принимают во внимание некоторые взаимосвязи, применение традиционного МНК к одному или нескольким уравнениям также широко распространено в эконометрике. В частности, при построении производственных функций анализ спроса можно вести, используя обычный МНК.

№22 ОСНОВНЫЕ ЭЛЕМЕНТЫ ВРЕМЕННОГО РЯДА.

Временной ряд - это совокупность значений какого-либо по­казателя за несколько последовательных моментов или периодов времени. Каждый уровень временного ряда формируется под воздействием большого числа факторов, которые условно можно подразделить на три группы:

Факторы, формирующие тенденцию ряда;

Факторы, формирующие циклические колебания ряда;

Случайные факторы.

При различных сочетаниях в изучаемом явлении или процессе этих факторов зависимость уровней ряда от времени может принимать различные формы. Во-первых, большинство времен­ных рядов экономических показателей имеют тенденцию, харак­теризующую совокупное долговременное воздействие множества факторов на динамику изучаемого показателя. Очевидно, что эти факторы, взятые в отдельности, могут оказывать разнонаправ­ленное воздействие на исследуемый показатель. Однако в сово­купности они формируют его возрастающую или убывающую тенденцию. Рис1

Во-вторых, изучаемый показатель может быть подвержен циклическим колебаниям. Эти колебания могут носить сезон­ный характер, поскольку экономическая деятельность ряда от­раслей экономики зависит от времени года рис2 Некоторые временные ряды не содержат тенденции и цикли­ческой компоненты, а каждый следующий их уровень образуется как сумма среднего уровня ряда и некоторой (положительной или отрицательной) случайной компоненты. Рис3

В большинстве случаев фактический уровень временного ря­да можно представить как сумму или произведение трендовой, циклической и случайной компонент. Модель, в которой вре­менной ряд представлен как сумма перечисленных компонент, называется аддитивной моделью временного ряда. Модель, в ко­торой временной ряд представлен как произведение перечислен­ных компонент, называется мультипликативной моделью времен­ного ряда. Основная задача эконометрического исследования от дельного временного ряда - выявление и придание количествен­ного выражения каждой из перечисленных выше компонент с тем, чтобы использовать полученную информацию для прогно­зирования будущих значений ряда или при построении моделей взаимосвязи двух или более временных рядов.

№23. АВТОКОРРЕЛЯЦИЯ УРОВНЕЙ ВРЕМЕННОГО РЯДА

Корреляционную зависимость между последова­тельными уровнями временного ряда называют автокорреляцией уровней ряда. Количественно ее можно измерить с помощью линейного ко­эффициента корреляции между уровнями исходного временного ряда и уровнями этого ряда, сдвинутыми на несколько шагов во времени. Коэффициент корреляции имеет вид:

можно определить коэффициенты автокорреля­ции второго и более высоких порядков. Так, коэффициент авто­корреляции второго порядка характеризует тесноту связи между уровнями у t и y t -1 и определяется по формуле:

Число периодов, по которым рассчитывается коэффициент автокорреляции, называют лагом. С увеличением лага число пар значений, по которым рассчитывается коэффициент автокорре­ляции, уменьшается.

Отметим два важных свойства коэффициента автокорреляции. Во-первых, он строится по аналогии с линейным коэффициентом корреляции и таким образом характеризует тесноту только линейной связи текущего и предыдущего уровней ряда.

Во-вторых, по знаку коэффициента автокорреляции нельзя делать вывод о возрастающей или убывающей тенденции в уров­нях ряда.

Последовательность коэффициентов автокорреляции уров­ней первого, второго и т. д. порядков называют автокорреляцион­ ной функцией временного ряда. График зависимости ее значений от величины лага на­зывается коррелограммой.

№24. МОДЕЛИРОВАНИЕ ТЕНДЕНЦИЙ ВРЕМЕННОГО РЯДА (АНАЛИТИЧЕСКОЕ ВЫРАВНИВАНИЕ ВРЕМЕННОГО РЯДА)

Одним из наиболее распространенных способов моделирова­ния тенденции временного ряда является построение аналитиче­ской функции, характеризующей зависимость уровней ряда от времени, или тренда. Этот способ называют аналитическим вы­ равниванием временного ряда.

Поскольку зависимость от времени может принимать разные формы, для ее формализации можно использовать различные ви­ды функций. Для построения трендов чаще всего применяются следующие функции:

Линейный тренд:

Гипербола: ,

Экспоненциальный тренд:

Тренд в форме степенной функции:

Парабола второго и более высоких порядков:

Параметры каждого из перечисленных выше трендов можно определить обычным МНК, используя в качестве независимой переменной время t=1,2,..., n, а в качестве зависимой перемен- 1 ной - фактические уровни временного ряда y t . Существует несколько способов определения типа тенденции. К числу наиболее распространенных способов относятся качественный анализ изучаемого процесса, построение и визуальный анализ графика зависимости уровней ряда от времени, расчет некоторых основных показателей динамики. В этих же целях можно использовать и коэффициенты автокорреляции уровней ряда. Тип тенденции можно определить путем сравнения коэф­фициентов автокорреляции первого порядка, рассчитанных по исходным и преобразованным уровням ряда. Если временной ряд имеет линейную тенденцию, то его соседние уровни у t и у t -1 тес­но коррелируют. В этом случае коэффициент автокорреляции первого порядка уровней исходного ряда должен быть высоким. Если временной ряд содержит нелинейную тенденцию, напри­мер, в форме экспоненты, то коэффициент автокорреляции пер­вого порядка по логарифмам уровней исходного ряда будет вы­ше, чем соответствующий коэффициент, рассчитанный по уров­ням ряда. Чем сильнее выражена нелинейная тенденция в изуча­емом временно м ряде, тем в большей степени будут различаться значения указанных коэффициентов.

Выбор наилучшего уравнения в случае, если ряд содержит не­линейную тенденцию, можно осуществить путем перебора ос­новных форм тренда, расчета по каждому уравнению скорректи­рованного коэффициента детерминации R 2 и выбора уравнения тренда с максимальным значением скорректированного коэффи­циента детерминации.

№;25. ММЕТОДЫ ИСКЛЮЧЕНИЯ ТЕНДЕНЦИЙ. МЕТОД ОТКЛОНЕНИЙ ОТ ТРЕНДА.

Сущность всех методов исключения тенденции заключается в том, чтобы устранить или зафиксировать воздействие фактора времени на формирование уровней ряда. Основные методы исклю­ чения тенденции можно разделить на две группы:

Методы, основанные на преобразовании уровней исходного
ряда в новые переменные, не содержащие тенденции. Полу­ченные переменные используются далее для анализа взаимо­связи изучаемых временных рядов. Эти методы предполага­ют непосредственное устранение трендовой компоненты Т из каждого уровня временного ряда. Два основных метода в
данной группе - это метод последовательных разностей и
метод отклонений от трендов;

Методы, основанные на изучении взаимосвязи исходных
уровней временных рядов при элиминировании воздействия
фактора времени на зависимую и независимые переменные
модели. В первую очередь это метод включения в модель рег­рессии по временным рядам фактора времени.
Рассмотрим подробнее методику применения, преимущества и недостатки каждого из перечисленных выше методов. Метод отклонений от тренда

Пусть имеются два временных ряда x t и y t каждый из которых содержит трендовую компоненту Т и случайную компоненту е. Проведение аналитического выравнивания по каждому из этих рядов позволяет найти параметры соответствующих уравнений трендов и определить расчетные по тренду уровни соответственно. Эти расчетные значения можно принять за оценку трендовой компоненты Т каждого ряда. Поэтому влияние тенденции можно устранить путем вычитания расчетных значений уровней ряда из фактических. Эту процедуру проделывают для каждого временного ряда в модели. Дальнейший анализ взаимосвязи ря­дов проводят с использованием не исходных уровней, а отклонений от тренда и при условии, что последние не содержат тенденции.

№26. МЕТОД ПОСЛЕДОВАТЕЛЬНЫХ РАЗНОСТЕЙ .

В ряде случаев вместо аналитического выравнивания времен­ного ряда с целью устранения тенденции можно применить более простой метод - метод последовательных разностей.

Если временной ряд содержит ярко выраженную линейную тенденцию, ее можно устранить путем замены исходных уровней ряда цепными абсолютными приростами (первыми разностями).

Пусть (1) ;

Тогда (6.3) Тогда

Коэффициент b - константа, которая не зависит от времени.

Если временной ряд содержит тенденцию в форме параболы второго порядка, то для ее устранения можно заменить исходные уровни ряда на вторые разности.

Пусть имеет место соотношение (1), однако

Тогда

Как показывает это соотношение, первые разности ∆ t , непо­средственно зависят от фактора времени t и, следовательно, со­держат тенденцию.

Определим вторые разности:

Очевидно, что вторые разности ∆ t 2 , не содержат тенденции, поэтому при наличии в исходных уровнях тренда в форме пара­болы второго порядка их можно использовать для дальнейшего анализа. Если тенденции временного ряда соответствует экспо­ненциальный или степенной тренд, метод последовательных раз­ностей следует применять не к исходным уровням ряда, а к их ло­гарифмам.

№27. ВКЛЮЧЕНИЕ В МОДЕЛЬ РЕГРЕССИИ ФАКТОРА ВРЕМЕНИ.

В корреляционно-регрессионном анализе устранить воздей­ствие какого-либо фактора можно, если зафиксировать воздейст­вие этого фактора на результат и другие включенные в модель факторы. Этот прием широко используется в анализе временных рядов, когда тенденция фиксируется через включение фактора времени в модель в качестве независимой переменной.

Модель вида относится к группе моделей, включающих фактор времени. Оче­видно, что число независимых переменных в такой модели может быть больше единицы. Кроме того, это могут быть не только те­кущие, но и лаговые значения независимой переменной, а также лаговые значения результативной переменной. Преимущество данной модели по сравнению с методами от­клонений от трендов и последовательных разностей в том, что она позволяет учесть всю информацию, содержащуюся в исход­ных данных, поскольку значения y t и х t есть уровни исходных временных рядов. Кроме того, модель строится по всей совокуп­ности данных за рассматриваемый период в отличие от метода последовательных разностей, который приводит к потере числа наблюдений. Параметры а и b модели с включением фактора вре­мени определяются обычным МНК.

Система нормальных уравнений имеет вид:

№28 .АВТОКОРРЕЛЯЦИЯ В ОСТАТКАХ. КРИТЕРИЙ ДАРБИНА-УОТСОНА.

Существуют два наиболее распространенных метода опреде­ления автокорреляции остатков. Первый метод - это построение графика зависимости остатков от времени и визуальное определение наличия или отсутствия автокорреляции. Второй метод - использо­ вание критерия Дарбина - Уотсона и расчет величины

Таким образом, d есть отношение суммы квадратов разностей последовательных значений остатков к остаточной сумме квадра­тов по модели регрессии. Можно предположить что: , предположим также

Коэффициент автокорреляции остатков оп­ределяется как

С учетом (3) имеем:

Таким образом, если в остатках существует полная положи­тельная автокорреляция и , то d = 0. Если в остатках полная отрицательная автокорреляция, то и, следовательно, d = 4.Если автокорреляция остатков отсутствует, то и d = 2. Следовательно, 0≤d≤4

Алгоритм выявления автокорреляции остатков на основе критерия Дарбина - Уотсона следующий. Выдвигается гипотеза Н 0 об отсутствии автокорреляции остатков. Альтернативные ги­потезы Н 1 Н 1 * состоят, соответственно, в наличии положитель­ной или отрицательной автокорреляции в остатках. Далее по спе­циальным таблицам определяются критичес­кие значения критерия Дарбина - Уотсона d l и d u для заданного числа наблюдений n, числа независимых переменных модели к и уровня значимости α. По этим значениям числовой промежуток разбивают на пять отрезков. Если фактическое значение критерия Дарбина - Уотсона по­падает в зону неопределенности, то на практике предполагают существование автокорреляции остатков и отклоняют гипотезу H о.

№29 . ОБЩАЯ ХАРАКТЕРИСТИКА МОДЕЛЕЙ С РАСПРЕДЕЛЕННЫМ ЛАГОМ. ИНТЕРПРИТАЦИЯ ПАРАМЕТРОВ МОДЕЛЕЙ С РАСПРЕДЕЛЕННЫМ ЛАГОМ .

Величину L, характеризующую запаздывание в воздействии фактора на результат, называют в эконометрике лагом, а временные ряды самих факторных переменных, сдвинутые на один ил более моментов времени, - лаговыми переменными.

Эконометрическое моделирование осуществляется с применением моделей, содержащих не только текущие, но и лаговые значения факторных переменных. Эти модели называются моделями с распределенным лагом. Модель вида

является примером модели с распределенным лагом.

Наряду с лаговыми значениями независимых, или факторных, переменных на величину зависимой переменной текущего периода могут оказывать влияние ее значения в прошлые моменты или периоды времени. Эти процессы обычно описывают с помощью моделей регрессии, содержащих в качестве факторов лаговые значения зависимой переменной, которые называются моделями авторегрессии. Модель вида

относится к моделям авторегрессии. Построение моделей с распределенным лагом и моделей ав­торегрессии имеет свою специфику. Во-первых, оценка парамет­ров моделей авторегрессии, а в большинстве случаев и моделей с распределенным лагом не может быть произведена с помощью обычного МНК ввиду нарушения его предпосылок и требует спе­циальных статистических методов. Во-вторых, исследователям приходится решать проблемы выбора оптимальной величины лага и определения его структуры. Наконец, в-третьих, между моделями с распределенным лагом и моделями авторегрессии су­ществует определенная взаимосвязь, и в некоторых случаях необ­ходимо осуществлять переход от одного типа моделей к другому. Интерпретация параметров моделей с распределительным лагом. Рассмотрим модель с распределенным лагом в ее общем виде в предположении, что максимальная величина лага конечна:

Эта модель говорит о том, что если в некоторый момент вре­мени t происходит изменение независимой переменной х, то это изменение будет влиять на значения переменной у в течение l следующих моментов времени.

Коэффициент регрессии b 0 при переменной x t характеризует среднее абсолютное изменение у t при изменении х t на 1 ед. свое­го измерения в некоторый фиксированный момент времени t , без учета воздействия лаговых значений фактора x. Этот коэффици­ент называют краткосрочным мультипликатором.

В момент (t+1) совокупное воздействие факторной перемен­ной x t на результат у t , составит (b 0 + b 1) усл. ед., в момент (t+2) это воздействие можно охарактеризовать суммой ( b 0 + b 1 + b 2 ) и т. д. Полученные таким образом суммы называют промежуточными мультипликаторами.

Введем следующее обозначение:

b 0 +b 1 +…+b l =b

Величину b называют долгосрочным мультипликатором. Он по­казывает абсолютное изменение в долгосрочном периоде t + l ре­зультата у под влиянием изменения на 1 ед. фактора х.

Предположим

ß j =b j /b, j=0:1

Назовем полученные величины относительными коэффициен­ тами модели с распределенным лагом. Сред­ ний лаг определяется по формуле средней арифметической взве­шенной: и представляет собой средний период, в течение которого будет происходить изменение результата под воздействием изменения фактора в момент времени t . Небольшая величина среднего лага свидетельствует об относительно быстром реагировании резуль­тата на изменение фактора, тогда как высокое его значение гово­рит о том, что воздействие фактора на результат будет сказывать­ся в течение длительного периода времени. Медианный лаг - это величина лага, для которого

Это тот период времени, в течение которого с момента време­ни t будет реализована половина общего воздействия фактора на результат.

№ 30 МЕТОД АЛМОНА.

В методе А. предполагается,что веса текущих лаговых значений объясняющих переменных подчиняются палениальному распределению. b j = c 0 +c 1 j+ c 2 j 2 +…+ c k j k

Уравнение регрессии примет вид y t = a+c 0 z 0 +c 1 z 1 + c 2 z 2 + c k z k +ε t , где z i =; i=1,…,k; j=1,…,p. Расчет параметров модели с распределенным лагом проводится по следующей схеме:

1. Устанавливается макси. величина лага l.

2. Определяется степень паленома k,описывающего структуру лага.

3. Рассчитывается значение переменных с z 0 до z k .

4. Определяются параметры уравнения линейной регрессии y t (z i).

5. Рассчитываются параметры исходной модели с распределенным лагом.

№ 31 МЕТОД КОЙКА.

В распределение Койка делается предположение, что коэффициенты при лаговых значениях объясняющей переменной убывают в геометрической прогрессии. b l =b 0 λ l ; l=0,1,2,3; 0 ≤ λ ≤ 1. Уравнение регрессии преобразовывается к виду:

y t =a+b 0 x t +b 0 λx t -1 +b 0 λ 2 x t -2 +…+ ε t . После несложных преобразований получаем ур-ие оценки параметров исходящего ур-ия.

№ 32 МЕТОД ГЛАВНЫХ КОМПОНЕНТ.

Суть метода - сократить число объясняющих пе­ременных до наиболее существенно влияющих факторов. Метод главных компонент применяется для исключе­ния или уменьшения мультиколлинеарности объясняющих пере­менных регрессии. Основная идея заключается в сокращении числа объясняющих переменных до наиболее существенно влия­ющих факторов. Это достигается путем линейного преобразова­ния всех объясняющих переменных x i (i=0,..,n) в новые пере­менные, так называемые главные компоненты. При этом требу­ется, чтобы выделению первой главной компоненты соответство­вал максимум общей дисперсии всех объясняющих переменных x i (i=0,..,n). Второй компоненте - максимум оставшейся дис­персии, после того как влияние первой главной компоненты ис­ключается и т. д.

Модели содержащие в качестве факторов лаговые знач. зависимой переменной называются моделями авторегрессии. Н-р y t =a+b 0 x t +c 1 y t -1 + ε t . Как и в модели с распределенным лагом b 0 и в этой модели характеризует краткосрочные изменения y t под воздействием изменения х 1 на 1 ед. Долгосрочный мультипликатор в модели авторегрессии рассчитывается как сумма краткосрочного и промежуточных мультипликаторов b = b 0 +b 0 c 1 +b 0 c 1 2 +b 0 c 1 3 +…=b 0 (1+c 1 +c 1 2 +c 1 3 +…)=b 0 /1-c 1

Отметим, что такая интерпретация коэффициентов модели авторегрессии и расчет долгосрочного мультипликатора основаны на предпосылке о наличие бесконечного лага в воздействии текущего знач. зависимой переменной на ее будущее знач.

Одним из возможных методов расчета параметров уравнения авторегрессии является метод инструментальных переменных. Сущность этого метода состоит в том, чтобы заменить перемен­ную из правой части модели, для которой нарушаются предпо­сылки МНК, на новую переменную, включение которой в модель регрессии не приводит к нарушению его предпосылок. Примени­тельно к моделям авторегрессии необходимо удалить из правой части модели переменную y t -1 . Искомая новая переменная, кото­рая будет введена в модель вместо y t -1ь должна иметь два свойст­ва. Во-первых, она должна тесно коррелировать с y t -1ь во-вторых, она не должна коррелировать с остатками u r .

Еще один метод, который можно применять для оценки пара­метров моделей авторегрессии типа - это метод максималь­ного правдоподобия

№34 ПРОВЕРКА СТАТИСТИЧЕСКИХ ГИПОТЕЗ. ????????????????????

№ 35 МЕТОД ПОДВИЖНОГО (СКОЛЬЗЯЩЕГО) СРЕДНЕГО.

Метод простого скользящего ср. состоит в том, что расчет показателя на прогнозируемый момент времени строится путем усреднения значения этого показателя за несколько предшествующих моментов времени.

где х k - i – реальное знач. показателя в момент времени t n -1.

n- число предшествующих моментов времени использующих при расчете.

f k – прогноз на момент времени t k .

№ 36 МЕТОД ЭКСПОНЕНЦИАЛЬНОГО СГЛАЖИВАНИЯ.

Учитываются отклонения предыдущего прогноза от реального показателя а сам расчет проводится по след. формуле:

где x k -1 – реальное значение показателя в момент времени t k -1 .

f k – прогноз на момент времени t k .

α – постоянное сглаживание.

Замечание: знач.α подчиняется условию 0‹ α ‹ 1, определяет степень сглаживания и обычно выбирается универсальным методом проб и ошибок.

№ 37 МЕТОД ПРОЕЦИРОВАНИЯ ТРЕНДА.

Основной идеей метода проецирования линейного тренда является построение прямой, которая в среднем наименее уклоняется от массива точек заданного временным рядом. Прямая ищется в виде: x = at + b (a и b -постоянные). Величины a и b удовлетворяют. следующей линейной системе:

№38. КАЗУАЛЬНЫЕ МЕТОДЫ ПРОГНОЗИРОВАНИЯ. КАЧЕСТВЕННЫЕ МЕТОДЫ ПРОГНОЗИРОВАНИЯ. ????????????????

Основой эконометрики является построение эконометрической модели и определение возможностей использования данной модели для описания анализа и прогнозирования реальных экономических процессов. Цели курсового проекта – разработка проектных решений по информационно-методическому обеспечению исследования в области эконометрического моделирования а также получение практических навыков построения и исследования эконометрических моделей. Конечной прикладной целью эконометрического моделирования реальных социально-экономических процессов в данном...


Поделитесь работой в социальных сетях

Если эта работа Вам не подошла внизу страницы есть список похожих работ. Так же Вы можете воспользоваться кнопкой поиск


МИНОБРНАУКИ РОССИИ

Федеральное государственное бюджетное образовательное учреждение

высшего профессионального образования

«Тверской государственный технический университет»

(ТвГТУ)

Институт дополнительного профессионального образования

Кафедра «Бухгалтерский учет, анализ и аудит»

Курсовой проект

По дисциплине: «Эконометрика»

На тему: «Сравнительный анализ эконометрических моделей регрессии»

ВЫПОЛНИЛА: студентка 3курса

Института ДПО и П

Группы РБАиА-37-12

Замятина

Кристина Дмитриевна

(Ф.И.О. студента)

ПРОВЕРИЛА:

Коновалова А. С.

(Ф.И.О. преподавателя)

Ржев 2015

ВВЕДЕНИЕ

ГЛАВА 1. АНАЛИТИЧЕСКАЯ ЧАСТЬ

Основы эконометрического исследования моделей регрессии.

Технология эконометрического исследования моделей регрессии.

ГЛАВА 2. ПРОЕКТНАЯ ЧАСТЬ

2.1 Информационно-методическое обеспечение

эконометрического исследования

Парная и множественная регрессии.

ЗАКЛЮЧЕНИЕ

Список ИСПОЛЬЗОВАННЫХ ИСТОЧНИКОВ

ВВЕДЕНИЕ

Эконометрика – это наука, предметом изучения которой являются количественные закономерности и взаимозависимости в экономике на основании методов математической статистики. Основой эконометрики является построение эконометрической модели и определение возможностей использования данной модели для описания, анализа и прогнозирования реальных экономических процессов.

Создавая возможность для принятия обоснованных экономических решений, эконометрический анализ является основой экономического анализа и прогнозирования.

В любой области экономики деятельность специалиста требует применения современных методов работы, основанных на эконометрических моделях, концепциях и приемах.

В качестве предмета эконометрического исследования в курсовом проекте выбрано количество прибывших в страны ЕС на постоянное место жительства. Миграционные процессы являются чрезвычайно важным фактором для оценки перспектив развития общества, поэтому актуальность темы исследования обуславливает рост социальной значимости этих процессов в современном мире.

Экономическое исследование миграционных процессов - существенный фактор повышения эффективности развития стран. История развития человечества неразрывно связана с изменениями динамики численности населения. В Европе быстрый рост населения обусловлен в первую очередь социально-экономическими изменениями, т.е. следует за экономическим ростом и изменениями в социальной сфере.

Цели курсового проекта – разработка проектных решений по информационно-методическому обеспечению исследования в области эконометрического моделирования, а также получение практических навыков построения и исследования эконометрических моделей.

Задача курсового проекта – использование на практике знаний и навыков в построении и исследовании эконометрических моделей для проведения эконометрического анализа данных.

Конечной прикладной целью эконометрического моделирования реальных социально-экономических процессов в данном курсовом проекте является прогноз экономических и социально-экономических показателей, характеризующих состояние и развитие анализируемой системы, то есть определение тенденций миграционных процессов в странах ЕС и их зависимость от имеющихся факторов, учитываемых при построении эконометрической модели.

ГЛАВА 1. АНАЛИТИЧЕСКАЯ ЧАСТЬ

1.1. Основы эконометрического исследования моделей регрессии.

Экономической дисциплиной, занимающейся разработкой и применением статистических методов для измерения взаимосвязей между эконометрическими переменными, является эконометрика, представляющая собой комбинацию экономической теории, статистики и математики.

Эконометрические данные не являются результатами контролируемого эксперимента. Эконометрика имеет дело с конкретными экономическими данными и занимается количественным описанием конкретных взаимосвязей, то есть заменяет коэффициенты, представленные в общем виде, конкретными численными значениями. В эконометрике разрабатываются специальные методы анализа, позволяющие снизить влияние ошибок измерения на полученные результаты.

Главный инструмент эконометрики - эконометрическая модель, то есть формализованное описание количественных взаимосвязей между переменными. В методологии моделирования заложены большие возможности саморазвития, поскольку моделирование – это циклический процесс, за каждым циклом может последовать следующий, а знания об исследуемом объекте расширяются и уточняются, исходная модель постепенно совершенствуется. Недостатки, обнаруженные после предыдущего цикла моделирования, обусловленные малым знанием объекта и ошибками в построении модели, можно исправить в последующих циклах.

Можно выделить три класса эконометрических моделей:

Модель временных данных;

Регрессионная модель с одним уравнением;

Система одновременных уравнений.

Классификация задач, решаемых с помощью эконометрической модели: 1) по конечным прикладным целям:

Прогноз эконометрических и социально-экономических показателей, характеризующих состояние и развитие анализируемой системы;

Имитация возможных сценариев социально-экономического развития системы.

2) по уровню иерархии:

Задачи макроуровня (страна в целом);

Задачи мезоуровня (регионы, отрасли, корпорации);

Микроуровень (семья, предприятие, фирма).

3) по профилю эконометрической системы, направленные на изучение:

Рынка;

Инвестиционной, финансовой или социальной политики;

Ценообразование;

Распределительных отношений;

Спроса и потребления;

Комплекса проблем.

Основные этапы эконометрического моделирования:

1 этап - постановочный. Определение конечных целей модели, набора участвующих в ней факторов и показателей, их роли. Основные цели исследований: анализ состояния и поведения экономического объекта, прогноз его экономических показателей, имитация развития объекта, выработка управленческих решений.

2 этап - априорный. Анализ сущности изучаемого объекта, формирование и формализация известной до начала моделирования информации.

3 этап - параметризация. Выбор общего вида модели, состава и формы входящих в нее связей. Основная задача этого этапа - выбор функции f(Х).

4 этап - информационный. Сбор необходимой статистической информации.

5 этап - идентификация модели. Статистический анализ модели и оценка ее параметров. Основная часть эконометрических исследований.

6 этап - верификация модели. Проверка адекватности модели, оценка точности модельных данных. Выясняется, насколько удачно решены проблемы спецификации и идентификации, какова точность расчетов по данной модели. Проверяется, насколько соответствует построенная модель моделируемому реальному экономическому объекту или процессу.

При моделировании экономических процессов в эконометрических моделях используют:

1. Пространственные данные - набор сведений по разным объектам, взятым за один и тот же период времени.

2. Временные данные - набор сведений, характеризующих один и тот же объект, но за разные периоды времени.

Набор сведений представляет собой множество признаков, характеризующих объект исследования. Признаки могут выступать в одной из двух ролей: роль результативного признака и роль факторного признака.

Переменные делятся на:

Экзогенные, значения которых задаются извне;

Эндогенные, значения которых определяются внутри модели;

Лаговые - эндогенные или экзогенные переменные эконометрической модели, датированные предыдущими моментами времени и находящиеся в уравнении с текущими переменными;

Предопределенные - экзогенные переменные, привязанные к прошлым, текущим и будущим моментам времени и лаговые эндогенные переменные, уже известные к данному моменту времени.

В эконометрике в основном рассматривают ошибки спецификации модели, предполагая, что ошибки измерения сведены к минимуму.

Спецификация модели - выбор вида функциональной зависимости (уравнения регрессии). Величина случайных ошибок не будет одна и та же для спецификаций модели, и сведение остаточного члена к минимуму позволяет выбрать наилучшую спецификацию.

Помимо выбора спецификации модели не менее важно также правильное описание структуры модели. Значение результативного признака может зависеть не от фактического значения объясняющей переменной, а от значения, которое ожидалось в предыдущем периоде.

Простейшая регрессионная модель всего лишь с двумя переменными входит в класс регрессионных моделей с одним уравнением, в которых одна объясняемая переменная представляется в виде функции от нескольких независимых (объясняющих) переменных и параметров. Этот класс включает модели множественной регрессии.

Более простыми являются модели временных рядов, которые объясняют поведение временного ряда, исходя только из его предыдущих значений, это модели:

Тренда,

Сезонности,

Адаптивного прогноза,

Скользящего среднего и др.

Более общими являются системы одновременных уравнений, в которых кроме объясняющих переменных в правых частях могут находиться также и объясняемые переменные из других уравнений, т.е. отличные от объясняемой переменной, стоящей в левой части данного уравнения.

При использовании отдельных уравнений регрессии предполагается, что факторы можно изменять независимо друг от друга, хотя в действительности их изменения не независимы, а изменение одной переменной чаще всего влечет за собой изменения во всей системе признаков, т.к. они являются взаимосвязанными. Необходимо уметь описывать структуру связей между переменными с помощью системы одновременных (структурных) уравнений.

Статистические и математические модели экономических явлений и процессов определяются спецификой той или иной области экономических исследований. Теория и практика экспертных оценок - важный раздел эконометрики, так как экспертные оценки используют для решения ряда экономических задач.

Более известными в теоретических и учебных публикациях являются различные эконометрические модели, предназначенные для прогнозирования макроэкономических показателей. Это обычно модели, имеющие целью прогнозирование многомерного временного ряда. Они представляют собой систему линейных зависимостей между прошлыми и настоящими значениями переменных. В таких задачах оценивают как структуру модели, т.е. вид зависимости между значениями известных координат вектора в прежние моменты времени и их значениями в прогнозируемый момент, так и коэффициенты, входящие в эту зависимость. Структура такой модели - объект нечисловой природы. Свои эконометрические модели соответствуют каждой области экономических исследований.

1.2. Технология эконометрического исследования моделей регрессии.

Исследование и количественная оценка объективно существующих взаимосвязей и зависимостей между экономическими явлениями - основная задача эконометрики.

Причинно-следственное отношение – это такая связь между явлениями, при которой изменение одного из них, называемого причиной, ведет к изменению другого, называемого следствием. Следовательно, причина всегда предшествует следствию.

Причинно-следственные отношения между явлениями представляют наибольший интерес для исследователя, что позволяет выявлять факторы, оказывающие основное влияние на вариацию изучаемых явлений и процессов.

Причинно-следственные связи в социально-экономических явлениях обладают следующими особенностями:

1. причина Х и следствие Y взаимодействуют не непосредственно, а через промежуточные факторы, которые при анализе опускаются.

2. социально-экономические явления развиваются и формируются в результате одновременного воздействия большого числа факторов. Одной из главных проблем при изучении этих явлений становится задача выявления основных причин и абстрагирование от второстепенных.

По направлению изменения связи подразделяются:

1. прямые (изменение результативного и факторного признаков происходит в одном направлении),

2. обратные (изменение результативного и факторного признаков происходит в противоположных направлениях).

По характеру проявления различают:

1. функциональная связь - связь, при которой определенному значению факторного признака соответствует одно и только одно значение результативного признака, проявляется во всех случаях наблюдения и для каждой конкретной единицы исследуемой совокупности, изучается в основном в естественных науках.

2. стохастическая зависимость - причинная зависимость, которая проявляется не в каждом отдельном случае, а в общем, при большом числе наблюдений, а одним и тем же значениям факторных признаков, как правило, соответствуют различные значения результативного признака, но, рассматривая всю совокупность наблюдений можно отметить наличие определенной зависимости между значениями признаков. Частным случаем стохастической связи является корреляционная связь, при которой изменение среднего значения результативного признака обусловлено изменением факторных признаков.

По аналитическому выражению выделяют связи:

1. линейные: изменение результативного признака прямо пропорционально изменению факторных признаков.

2. нелинейные.

Аналитически линейная стохастистическая связь между явлениями может быть представлена уравнением прямой линии на плоскости, либо уравнением гиперплоскости в n-мерном пространстве (при наличии n факторных переменных).

Построение эконометрической модели - это основа эконометрического исследования. От того, насколько хорошо полученная модель описывает изучаемые закономерности между экономическими процессами, зависит степень достоверности результатов анализа и их применимости.

Построение эконометрической модели начинается со спецификации модели, заключающейся в получении ответа на два вопроса:

1) какие экономические показатели должны быть включены в модель;

2) какой вид имеет аналитическая зависимость между отобранными признаками.

В исследованиях, посвященных разработке методов прогнозирования таких финансовых показателей, как курсы валют, ценных бумаг, индексов широко применяются модели, основанные на предположении, что динамика этих процессов полностью определяется внутренними условиями.

После выделения совокупности рассматриваемых переменных следующим этапом является определение конкретного вида модели, наилучшим образом соответствующего изучаемому явлению.

По характеру связей факторов с переменной у модели подразделяются на линейные и нелинейные. По свойствам своих параметров модели подразделяются на модели с постоянной и переменной структурой.

Особый вид моделей составляют системы взаимосвязанных эконометрических уравнений.

Если на основе предварительного качественного анализа рассматриваемого явления не удается однозначно выбрать наиболее подходящий тип модели, то рассматриваются несколько альтернативных моделей, среди которых в процессе исследования выбирается та, которая в наибольшей степени соответствует изучаемому явлению.

В общем случае процедуру построения эконометрической модели можно представить в виде следующих этапов:

1. Спецификация модели, т. е. выбор класса моделей, наиболее подходящих для описания изучаемых явлений и процессов.

Этот этап предполагает решение двух задач:

а) отбор существенных факторов для их последующего включения в модель;

б) выбор типа модели, т. е. выбор вида аналитической зависимости, связывающей включенные в модель переменные.

2. Оценка параметров модели, т. е. получение численных значений констант модели. При этом используется предварительно полученный массив исходных данных.

3. Проверка качества построенной модели и обоснование возможности ее дальнейшего использования. Наиболее сложным и трудоемким в эконометрическом исследовании является этап оценки параметров модели, где применяются методы теории вероятностей и математической статистики.

При решении проблемы выбора вида аналитической зависимости могут использоваться различные соображения:

Выводы аналитических исследований о качественном характере зависимости,

Описание свойств различных аналитических зависимостей,

Цели построения модели.

Выбор вида эконометрической модели основывается, прежде всего, на результатах предварительного качественного или содержательного анализа, проводимого методами экономической теории. Характер предполагаемой зависимости обосновывается исходя из теоретически предположений о характере закономерности развития изучаемого явления или процесса.

Другой подход основан на анализе массива исходных данных, который позволяет выявить некоторые характеристики предполагаемых зависимостей и на этой основе сформулировать, как правило, несколько предположений о виде аналитической связи. Построенная модель используется для формулирования предположений о характере закономерности в развитии изучаемого явления, которые проверяются в течение дальнейших исследований.

Наибольшее применение в эконометрике нашли линейные модели.

Это обусловлено несколькими причинами:

Существуют эффективные методы построения таких моделей.

В небольшом диапазоне значений факторных признаков линейные модели с достаточной точностью могут аппроксимировать реальные нелинейные зависимости.

Параметры модели имеют наглядную экономическую интерпретацию.

Прогнозы по линейным моделям, характеризуются меньшим риском значительной погрешности прогноза.

Важной составляющей процесса построения эконометрической модели является отбор факторов, существенно влияющих на изучаемый показатель и подлежащих включению в разрабатываемую модель. Оптимальный набор факторов определяется на основе качественного и количественного анализа.

На этапе постановки задачи и содержательного экономического анализа экономической модели отбираются факторы, влияние которых должно быть учтено при построении модели. В ряде случаев набор факторов определяется однозначно или с большой степенью уверенности. В более сложных случаях на следующем этапе с помощью формальных статистических методов проверяется целесообразность включения в модель каждого фактора. Прежде всего, факторы проверяются на наличие тесной линейной корреляционной зависимости между ними, существование которой приводит к получению ненадежных оценок параметров модели.

Для преодоления сильной межфакторной корреляции применяются:

– исключение из модели одного или нескольких факторов. Из двух коррелирующих факторов исключаются тот, который более коррелирует с остальными факторами;

– преобразование факторов, при котором уменьшается корреляция между ними.

Одним из критериев включения факторов в модель является степень их изолированного влияния на результативный признак.

Два метода определения оптимального набора факторов:

1. метод включения. Строится уравнение регрессии с одним наиболее влияющим фактором, затем в него последовательно вводятся следующие факторы и определяется пара наиболее влияющих факторов, затем к первым двум добавляется еще по одному фактору и определяется наилучшая тройка факторов и т. д. На каждом шаге строится модель регрессии и проверяется значимость факторов. В модель включают только значимые факторы. Для проверки значимости фактора могут использоваться либо критерий Стьюдента, либо частный критерий Фишера. Процесс заканчивается, когда не остается факторов, которые следует включить в модель.

2. метод исключения. Строится уравнение регрессии с полным набором факторов, из числа которых затем последовательно исключаются незначимые или наименее значимые факторы. На каждом шаге исключается только один фактор, так как после исключения какого-либо фактора другой фактор, бывший до этого незначимым, может стать значимым. Процесс заканчивается, когда не остается факторов, которые следует исключить.

Методы включения и исключения не гарантируют определение оптимального набора факторов, но в большинстве случаев дают результаты либо оптимальные, либо близкие к ним. Не рекомендуется включать в модель очень большое число факторов, так как это может затруднить выявление качественных закономерностей и возрастает опасность включения в модель несущественных случайных факторов. Для получения надежных оценок параметров желательно, чтобы количество наблюдений превышало количество определяемых параметров не менее чем в 6-7 раз.

После отбора факторов и выбора вида аналитической зависимости осуществляется оценка параметров модели. При оценке параметров модели в качестве исходных данных используется заранее подготовленный массив наблюдений. Качество оценок определяется наличием у них таких свойств как несмещенность, состоятельность и эффективность. Оценка параметра называется несмещенной, если ее математическое ожидание равно оцениваемому параметру. Оценка параметра называется состоятельной, если она сходится по вероятности к оцениваемому параметру при возрастании количества наблюдений. Оценка параметра называется эффективной, если она имеет наименьшую дисперсию среди возможных несмещенных оценок параметра, вычисленных по выборкам одного и того же объема n.

ГЛАВА 2. ПРОЕКТНАЯ ЧАСТЬ

2.1 Информационно-методическое обеспечение эконометрического исследования.

Методика эконометрического исследования включает следующие этапы: спецификация; параметризация, верификация, дополнительное исследование.

1. Спецификация моделей уравнения парной и множественной регрессии включает анализ корреляционной зависимости зависимой переменной от каждой объясняющей переменной. По результатам анализа делается заключение о модели уравнения регрессии. В результате этапа определяется модель уравнения регрессии.

2. Параметризация уравнения парной регрессии предполагает оценку параметров регрессии и их социально-экономическую интерпретацию. Для параметризации рекомендуется использовать инструмент «Регрессия» в составе надстроек «Анализ данных» MsExcel. По результатам автоматизированного регрессионного анализа определяются параметры регрессии, также дается их интерпретация.

Таким образом, эконометрическое исследование парной регрессии включает расчет параметров уравнений регрессии, оценку дисперсий ошибок и дисперсий параметров модели, оценку силы связи фактора с результатом с помощью коэффициента эластичности, оценку тесноты связи, оценку качества уравнения с помощью средней ошибки аппроксимации, оценку статистической надежности уравнений регрессии с помощью F-критерия Фишера.

Для построения и анализа парной регрессии из статистического ежегодника выбран список из двадцати наиболее крупных стран Европейского союза, а именно число прибывших в страну на постоянное место жительства и номинальная годовая заработная плата наемных работников.

Рассчитывается коэффициент корреляции по формуле:

Где

Коэффициент корреляции показывает тесноту связи изучаемых явлений.

Для построения уравнения парной регрессии необходимо рассмотреть возможные уравнения регрессии:

  1. линейную зависимость
  2. показательную зависимость
  3. квадратичную зависимость
  4. кубическую зависимость

Для оценки параметров регрессий ко всем этим моделям применим метод наименьших квадратов (МНК).

Идея метода состоит в получении наилучшего приближения набора наблюдений x i , y i , i = 1,…, n линейной функцией в смысле минимизации функционала:

Для расчета параметров a и b линейной регрессии решается система уравнений относительно a и b .

из которой можно определить оценки параметров a и b .

t –критерием Стьюдента.

Выдвигается гипотеза H 0 о случайной природе показателя, т.е. незначимом его отличии от нуля. H 0 : =0

Построению уравнения показательной кривой предшествует процедура линеаризации переменных при логарифмировании обеих частей уравнения:

Параметры уравнения модели находятся по следующим формулам:

Получено линейное уравнение.

х , можно получить теоретические результаты значения. По ним рассчитывается показатель тесноты связи – индекс корреляции.

Проверяется данный коэффициент на значимость, воспользовавшись t –критерием Стьюдента.

Расчет оценок дисперсий ошибок и дисперсий параметров модели осуществляется по следующим формулам:

Производится построение уравнения квадратичной кривой, произведя замену

Подставляя в уравнение фактические значения х

Проверяется данный коэффициент на значимость, воспользовавшись t –критерием Стьюдента.

Расчет оценок дисперсий ошибок и дисперсий параметров модели осуществляется по следующим формулам:

Производится построение уравнения кубической кривой, произведя замену

Получается линейное уравнение

Подставляя в данное уравнение фактические значения х , можно получить теоретические результаты значения. По ним рассчитаем показатель тесноты связи – индекс корреляции.

Проверяется данный коэффициент на значимость, воспользовавшись t –критерием Стьюдента.

Расчет оценок дисперсий ошибок и дисперсий параметров модели осуществляется по следующим формулам:

Средний коэффициент эластичности показывает, на сколько процентов в среднем по совокупности изменится результат у от своей средней величины при изменении фактора х на 1% от своего среднего значения:

Коэффициент детерминации дает оценку качества построенной модели. Коэффициент детерминации характеризует долю дисперсии результирующего признака у, объясняемую регрессией, в общей дисперсии результативного признака.

Коэффициент детерминации равен квадрату индекса корреляции. Чем ближе к единице, тем лучше качество подгонки, т.е. более точно аппроксимирует у.

Средняя ошибка аппроксимации – среднее отклонение расчетных значений от фактических:

Допустимый предел значений - не более 8-10%.

Оценка значимости уравнения регрессии осуществляется с помощью F -критерия Фишера. При этом выдвигается нулевая гипотеза о равенстве фактической и остаточной дисперсий, и следовательно, фактор x не оказывает влияния на y , т.е.

H 0 : D факт = D ост

Для этого выполняется сравнение фактического и критического (табличного) значений F -критерия Фишера. определяется из соотношения значений факторной и остаточной дисперсий:

Максимально возможное значение критерия под влиянием случайных факторов при данных степенях свободы и уровне значимости. Уровень значимости - вероятность отвергнуть правильную гипотезу при условии, что она верна.

Если <, то отклоняется и признается статистическая значимость и надежность уравнения регрессии, иначе - принимается и делается вывод о не значимости уравнения регрессии.

3. Параметризация уравнения множественной регрессии предполагает оценку параметров регрессии и их социально-экономическую интерпретацию. Для параметризации рекомендуется использовать инструмент «Регрессия» в составе надстроек «Анализ данных» MsExcel. По результатам автоматизированного регрессионного анализа определяются параметры регрессии, также дается их интерпретация.

Верификация уравнения регрессии проводится на основе результатов автоматизированного регрессионного анализа.

Таким образом, эконометрическое исследование множественной регрессии включает в себя построение уравнения множественной регрессии, расчет коэффициентов эластичности для каждого фактора и сравнительную оценку силы связи каждого фактора с результатом, экономическую интерпретацию построенной модели, построение матрицы корреляции, вычисление коэффициента множественной корреляции, расчет оценок дисперсий ошибок модели и оценок параметров модели, построение доверительных интервалов для коэффициентов модели с выбранным уровнем значимости, проверку значимости каждого коэффициента, оценку тесноты связи, оценку статистической надежности уравнения регрессии с помощью F – критерия Фишера.

Для построения и анализа множественной регрессии вводятся в модель еще несколько показателей, позволяющих учитывать несколько факторов, влияющих на число прибывших в страну на постоянное место жительства. А именно такие факторы как число безработных и ВВП страны.

Множественная регрессия – уравнение связи с несколькими неизвестными переменными:

где y – зависимая переменная (результативный признак),

Независимые переменные (факторы).

Для построения уравнения множественной регрессии используется линейная функция, записанная в матричной форме:

где,

Для оценки параметров уравнения множественной регрессии применяют метод наименьших квадратов:

Строится следующая система уравнений, решение которых позволяет получить оценки параметров регрессии:

Ее решение в явном виде обычно записывается в матричной форме, иначе оно становится слишком громоздким.

Оценки параметров модели в матричной форме определяются выражением:

X – матрица значений объясняющих переменных;

Y – вектор значений зависимой переменной.

Для выявления зависимости числа прибывших на постоянное место жительства от номинальной годовой з/п наемных рабочих, числа безработных и уровня ВВП построим уравнение множественной регрессии в виде:

Для характеристики относительной силы влияния факторов на y рассчитаем средние коэффициенты эластичности. Средние коэффициенты эластичности для линейной регрессии рассчитываются по формулам:

При линейной зависимости коэффициент множественной корреляции можно определить через матрицу парных коэффициентов корреляции:

где - определитель матрицы парных коэффициентов корреляции;

Определитель матрицы межфакторной корреляции.

Матрица парных коэффициентов корреляции:

Матрица межфакторной корреляции:

Расчет оценок дисперсий ошибок и дисперсий параметров модели осуществляется по следующим формулам:

Для оценки статистической значимости коэффициентов регрессии рассчитываются t -критерий Стьюдента и доверительные интервалы каждого из параметров. Выдвигается гипотеза о случайной природе показателей, т.е. о незначимом их отличии от нуля. Получим набор гипотез:

: b 0 =0; b 1 =0; b 2 =0; b 3 =0

t -критерия Стьюдента проводится путем сопоставления их значений с табличным значением, вычисляемым как квантиль распределения Стьюдента, где уровень значимости - вероятность отвергнуть правильную гипотезу при условии, что она верна.

Для расчета доверительных интервалов пользуются следующей формулой:

Качество построенной модели в целом оценивает коэффициент детерминации. Коэффициент множественной детерминации рассчитывается, как квадрат индекса множественной корреляции: .

Скорректированный индекс множественной детерминации содержит поправку на число степеней свободы и рассчитывается по формуле:

где n – число наблюдений;

m – число факторов.

Значимость уравнения множественной регрессии в целом, так же как и в парной регрессии, оценивается с помощью F- критерия Фишера:

При этом выдвигается гипотеза о незначимости уравнения регрессии:

В заключение формируется суждение о качестве уравнения регрессии.

4. Проводится сравнительный анализ моделей регрессии.

2.2. Пример эконометрического исследования.

На основе статистических данных проводится эконометрическое исследования в соответствие с методикой п.2.1.

Все необходимые расчеты проводятся при помощи MS Excel, рассчитывая в ручную, при помощи функций пакета анализа данных «Регрессия» проводится проверка полученных результатов.

Линейный коэффициент парной корреляции равен:

0,504652547

Коэффициент корреляции имеет положительное значение и равен, умеренная прямая зависимость между показателем y и фактором x : с увеличением среднегодовой з/п работников страны, количество прибывшего в страну населения увеличивается.

2. Проводится построение и анализ парной регрессии. Исходные данные представлены в Таблице 1.

Таблица 1. Исходные данные для построения и анализа парной регрессии

y - число прибывших в страну на постоянное место жительства, тыс. чел;

В результате анализа необходимо установить насколько заработная плата наемных рабочих в стране влияет на количество людей, прибывших в страну на постоянное место жительство.

Оценка параметров a и b .

Уравнение регрессии:

Коэффициент регрессии b =4,279 показывает среднее изменение результата с изменением фактора на одну единицу: с увеличением годовой з/п наемных рабочих на 1 тыс.евро. количество прибывших на постоянное место жительства увеличится в среднем на 4,279 тыс. чел. Положительное значение коэффициента регрессии показывает прямое направление связи.

Линейный коэффициент парной корреляции равен:

0,504652547

Связь прямая и умеренная.

2.47 T табл (0,05;18) = 2,101

> T табл , коэффициент значим.

Проводится расчет оценок дисперсий ошибок и дисперсий параметров модели. Промежуточные расчеты представлены в Таблице 2.

10765,218 = 1477,566815 = 2,976774696

Построение уравнения показательной кривой.

Значения параметров регрессии составили

0,068027 = 1,68049

Получено линейное уравнение: .

После потенцирования:

Индекс корреляции.

Проверяется данный коэффициент на значимость.

2.15 T табл (0,05;18) = 2,101

> T табл , коэффициент значим.

Проводится расчет оценок дисперсий ошибок и дисперсий параметров модели. Промежуточные расчеты представлены в Таблице 3.

В результате получены следующие значения:

11483,75 = 452,87517 = 3,1754617

Таблица 2. Расчет значений для линейной модели

Таблица 3. Расчет значений для показательной модели

Строится уравнение квадратичной кривой.

Параметры уравнения:

Индекс корреляции.

Проверяется данный коэффициент на значимость.

3,41 T табл (0,05;18) = 2,101

> T табл , коэффициент значим.

Проводится расчет оценок дисперсий ошибок и дисперсий параметров модели. Промежуточные расчеты представлены в Таблице 4.

В результате получены следующие значения:

8760,35808 = 743,283328 = 0,00123901

Строится уравнение кубической кривой.

Параметры уравнения:

Уравнение регрессии принимает вид:

Индекс корреляции.

Проверяется данный коэффициент на значимость.

4,38 T табл (0,05;18) = 2,101

> T табл , коэффициент значим.

Проводится расчет оценок дисперсий ошибок и дисперсий параметров модели. Промежуточные расчеты представлены в Таблице 5.

В результате получены следующие значения:

6978,45007 = 514,7649432 = 5,9851E-07

Самая высокая степень связи переменных в модели с кубической зависимостью, т.к. коэффициент корреляции в кубической модели наиболее близок к единице, а самая низкая - в показательной модели. Дисперсии ошибок и параметров модели принимают минимальные значения в кубической.

Таблица 4. Расчет значений для квадратичной модели

Таблица 5. Расчет значений для кубической модели

Находится средний коэффициент эластичности.

Линейная зависимость

1,250028395 %.

Показательная зависимость

1,2083965

С ростом годовой заработной платы наемных рабочих на 1% число прибывших в страну на постоянное место жительства увеличивается на 1,2083965 % .

Квадратичная зависимость

С ростом годовой заработной платы наемных рабочих на 1% число прибывших в страну на постоянное место жительства увеличивается на 1,24843054 % .

Кубическая зависимость

0,938829224

С ростом годовой заработной платы наемных рабочих на 1% число прибывших в страну на постоянное место жительства увеличивается на 0,938829224 % .

Значения коэффициентов эластичности приведены в Таблице 6.

Все построенные модели подтверждают, что величина заработной платы наемных рабочих является фактором увеличения числа прибывших в страну на постоянное место жительства. Коэффициент эластичности показывает, что годовая заработная плата наемных рабочих в больше степени влияет на число прибывших в страну на постоянное место жительства при линейной и квадратичной зависимостях. В меньшей степени данная связь прослеживается в кубической зависимости.

Находится коэффициент детерминации.

Линейная зависимость

Уравнением регрессии объясняется 25% дисперсии результативного признака, а на долю остальных факторов приходится 75% ее дисперсии.

Модель линейной зависимости плохо аппроксимирует исходные данные.

Показательная зависимость =

Зависимость между показателями такая же слабая, как и в линейной модели. Вариация у всего на 20% объясняется вариацией х , а на долю остальных факторов приходится 80%. Связь в данной модели самая слабая. Поэтому качество модели неудовлетворительное.

Квадратичная зависимость

Зависимость между показателями немного лучше, чем в показательной и линейной моделях. Вариация у только на 40% объясняется вариацией х. Данную модель также не желательно использовать для прогнозирования.

Кубическая зависимость

Зависимость между показателями лучше, чем в предыдущих моделях. Вариация у на 52% объясняется вариацией х.

Значения коэффициентов детерминации представлены в Таблице 6.

Таблица 6. Расчет параметров и характеристик моделей.

Качество построенных моделей низкое , самая высокая оценка качества у модели с кубической зависимостью, так как доля объясненной вариации составила 52%.

Определяется средняя ошибка аппроксимации – среднее отклонение расчетных значений от фактических:

Линейная модель = 1153,261 %

В среднем расчетные значения отклоняются от фактических на 1153,261 %, что говорит об очень большой ошибке аппроксимации.

Показательная зависимость = 396,93259

Ошибка аппроксимации несколько ниже, чем у остальных моделей, но также является недопустимой.

Квадратичная зависимость = 656,415018

Наблюдается высокая ошибка аппроксимации, что свидетельствует о низком качестве подгонки уравнения

Кубическая зависимость = 409,3804652

Ошибка аппроксимация также значительно превышает допустимые значения. Во всех рассмотренных моделях средняя ошибка аппроксимации значительно превышает допустимые значения, качество подгонки моделей к исходным данным очень низкое.

3. Проводится построение и анализ множественной регрессии.

Исходные данные для построения множественной регрессии приведены в Таблице 7.

Таблица 7. Исходные данные для построения множественной регрессии.

y - число прибывших в страну на постоянное место жительства, тыс. чел:

x 1 - номинальная годовая заработная плата наемных работников, тыс. евро.

x 2 - число безработных, тыс. чел.

x 3 - ВВП, млрд. евро.

Оценки параметров уравнения регрессии:

Уравнение множественной регрессии:

Средние коэффициенты эластичности.

0,12026241 = -0,06319176 = 0,86930458

Расчет данных значений приведен в Таблице 8.

С увеличением величины годовой заработной платы наемных рабочих на 1% от среднего уровня при неизменных показателях остальных факторов, число прибывших на постоянное место жительства увеличивается на 0,12 %.

С увеличением численности безработных на 1% от среднего при неизменных показателях остальных факторов, число прибывших на постоянное место жительства уменьшается на 0,06 %

С увеличением величины ВВП на 1% от среднего при неизменных показателях остальных факторов, число прибывших на постоянное место жительства увеличивается на 0,87 %

Изменение числа прибывших в страну на постоянное место жительства находится в прямой зависимости от годовой заработной платы наемных рабочих и величины уровня ВВП страны и в обратной зависимости от численности безработных, что не противоречит и логическим предположениям. Коэффициенты эластичности, как показатели силы связи, показывают, что наибольшее изменение числа прибывших в страну вызывает величина ВВП, а наименьшее – численность безработных.

Рассчитывается коэффициент множественной корреляции:

Значение индекса множественной корреляции лежит в пределах от 0 до 1.

Рассчитывается средняя ошибка аппроксимации:

372,353247%

Значение средней ошибки аппроксимации свидетельствует о плохой подгонке модели под исходные данные.

Таблица 8. Расчет значений характеристик модели множественной регрессии

Совместное влияние всех факторов на число прибывших в страну на постоянное место жительства достаточно велико. С вязь между рассматриваемым показателем и влияющими на него факторами усилилась по сравнению с парной регрессией (r yx =0.506). Наблюдается довольно сильная связь.

Необходимо учитывать, что в модели наблюдается небольшая мультиколлинеарность, что может свидетельствовать о ее неустойчивости, поскольку определитель матрицы межфакторной корреляции достаточно далек от 1. Максимальный коэффициент парной корреляции наблюдается между факторами x 1 и x 3 (r x 1 x 3 =0.595), что вполне объясняемо, т.к. среднегодовая заработная плата в стране должна находиться в прямой зависимости от ВВП страны.

Расчет оценок дисперсий ошибок и дисперсий параметров модели:

n = 20 – количество наблюдений, m =4 – количество параметров.

Для построенной модели оценка дисперсии ошибок составила:

6674,02207

Оценки дисперсий параметров модели:

Стандартные ошибки параметров модели:

Промежуточные расчеты полученных данных представлены в приложении 8.

Оценка значимости коэффициентов регрессии с помощью t -критерия Стьюдента.

Значения, <, значит коэффициенты являются статистически незначимыми и случайно отличаются от 0.

>, значит является статистически значимым

Для построенной модели доверительные интервалы коэффициентов регрессии:

Все полученные коэффициенты регрессии, кроме , статистически незначимы, доверительные интервал для них достаточно большой, что может свидетельствовать о недостаточном качестве модели.

Коэффициент множественной детерминации для построенной модели

Данный коэффициент детерминации показывает, что качество модели удовлетворительное.

С добавлением еще одной переменной обычно увеличивается. Для того чтобы не допускать возможного преувеличения тесноты связи и применяется скорректированный коэффициент детерминации. При заданном объеме наблюдений при прочих равных условиях с увеличением числа независимых переменных (параметров) скорректированный коэффициент множественной детерминации убывает. Для построенной модели значения скорректированного и нескорректированного коэффициента детерминации не значительно отличаются друг от друга, но т.к. скорректированный коэффициент детерминации немного уменьшился можно предположить, что увеличение доли объясненной регрессии при добавлении новой переменной незначительно, и что добавлять переменную нецелесообразно.

Оценка значимости уравнения регрессии с помощью F -критерия Фишера.

F (0.05, m -1, n - m )= F (0.05,1,18)= 4,413873

Линейная модель = 6,150512218

Показательная зависимость = 4,6394274

Квадратичная зависимость = 11,6775003

Кубическая зависимость = 19,25548322

Во всех рассмотренных моделях <, гипотеза отвергается.

Значимость уравнения множественной регрессии в целом с помощью F- критерия Фишера:

Так как F табл < F факт то не принимается

4. В результате проведенного исследования можно сделать следующее заключение: Все полученные уравнения регрессии значимы. По результатам F -теста и показателям коэффициента детерминации и средней ошибки аппроксимации можно сделать вывод, что среди рассмотренных моделей парной регрессии нет модели с хорошим качеством, которую можно было бы применять с целью прогнозирования. Однако, наилучшей моделью, описывающей взаимосвязь между годовой з/п наемных рабочих страны и числом прибывших в страну на постоянное место жительства, является модель с кубической зависимостью, поскольку она является значимой, коэффициент детерминации принимает наибольшее значение и средняя ошибка аппроксимации не так велика по сравнению с другими моделями, хотя и не принимает допустимого значения.

Все четыре модели парной регрессии являются статистически значимыми, однако достаточно малые значения коэффициента детерминации, большие ошибки средней аппроксимации свидетельствуют о плохом качестве данных моделей.

Сравнив параметры и характеристики данных уравнений, делается вывод, что наибольшей надежность и точностью обладает модель с кубической зависимостью. Об этом свидетельствуют наибольшее значение индекса корреляции и соответственно коэффициент детерминации, наиболее близкий к 1 и подтверждающий лучшее качество модели с точки зрения аппроксимации данных, результаты F-теста, признавшие модель значимой, а также средняя ошибка аппроксимации, меньшая, чем у других моделей. Стандартные ошибки параметров регрессии и стандартная ошибка прогноза для этой модели также принимают меньшие значения.

Уравнение множественной регрессии значимо, т.е. отвергается гипотеза о случайной природе оцениваемых характеристик. Полученная модель статистически надежна.

ЗАКЛЮЧЕНИЕ

В результате эконометрического исследования и анализа данных было рассмотрено четыре уравнения парной регрессии, устанавливающих зависимость между среднегодовой заработной платой наемных рабочих в стране и количеством людей, прибывших в страну на постоянное место жительство. Это линейная модель, показательная, модели с квадратичной и кубической зависимостью. Все построенные модели подтверждают, что рост величины заработной платы наемных рабочих, является фактором увеличения числа прибывших в страну на постоянное место жительства.

Самый высокий показатель тесноты связи переменных в модели с кубической зависимостью, т.к. коэффициент детерминации в кубической модели принимает наибольшее значение, что говорит о наибольшей надежности найденного уравнения регрессии. Модель в виде кубической зависимости наилучшим образом описывает взаимосвязь числа прибывших в страну на постоянное место жительства и годовой заработной платы наемных рабочих. Во всех рассмотренных моделях средняя ошибка аппроксимации значительно превышает допустимые значения, что говорит о низком качестве подгонки моделей. Однако модель с кубической зависимостью является лучшей с точки зрения аппроксимации данных и оценки тесноты связи, поскольку имеет наибольшую по сравнению с другими моделями долю объясненной вариации – 52% (коэффициент детерминации наиболее близок к 1).

По всем рассмотренным параметрам, уравнение регрессии с кубической зависимостью, является лучшим из рассмотренных. Но не оптимальным для практического использования и прогнозирования, что объясняется большим разбросом данных, а также тем, что число иммигрантов зависит от множества факторов, которые невозможно учесть в парной регрессии.

Не достаточно хорошие характеристики модели могут быть вызваны наличием в исходных данных единиц с аномальными значениями исследуемых признаков: в Великобритании число прибывших на постоянное место жительства значительно превышает данный показатель для других стран. Возможно, для получения более точного и надежного результата данную страну следует исключить из выборки.

В результате построения множественной регрессии исследовано влияние на число прибывших в страну на постоянное место жительства таких факторов, как ВВП страны, численность безработных и средняя годовая заработная плата наемных рабочих.

Изменение числа прибывших в страну на постоянное место жительства находится в прямой зависимости от годовой заработной платы наемных рабочих и величины уровня ВВП страны и в обратной зависимости от численности безработных. Наибольшее изменение числа прибывших в страну вызывает величина ВВП, а наименьшее – численность безработных.

Совместное влияние всех факторов на число прибывших в страну на постоянное место жительства достаточно велико, поскольку индекс множественной корреляции принимает высокое значение. Однако это может объясняться наличием мультиколлинеарности.

Все полученные коэффициенты уравнения множественной регрессии кроме коэффициента при факторе уровень ВВП статистически незначимы, доверительные интервал для них достаточно большой.

Не смотря на это, коэффициент детерминации показывает, что качество модели удовлетворительное. Уравнение множественной регрессии значимо, т.е. отвергается гипотеза о случайной природе оцениваемых характеристик.

Однако в модели может наблюдаться гетероскедастичность, т.е. возможно необходима коррекция модели.

Данные результаты можно объяснить достаточно малым объемом выборки, в особенности с учетом глобальности исследования, наличием аномального значения исследуемого признака, не учтенностью каких-либо существенных факторов, а также тем, что число эмигрантов в страну зависит от большого числа не количественных, личных факторов, индивидуальных предпочтений.

Не смотря на отсутствие точного результата и качественного уравнения регрессии, пригодного для прогнозирования и дальнейших исследований, в ходе исследования удалось выявить, что заработная плата наемных рабочих в стране, уровень безработицы и ВВП оказывают немаловажное влияние на число прибывших в страну на постоянное место жительства.

Список использованных источников

1. Герасимов, А.Н. Эконометрика: теория и практика [Электронный ресурс]: электронный учебник / Герасимов, А.Н., Гладилин, А.В., Громов, Е.И. - М.: КноРус, 2011. - CD. - (82803-2) (У; Г 37)

2. Яковлева, А. Заказ. Эконометрика: курс лекций - М.: Эксмо, 2010. - (83407-1)

3. Валентинов, В.А. Эконометрика [Текст]: практикум - М.: Дашков и К, 2010. - 435 с. - (84265-12) (У; В 15)

4. Валентинов, В.А. Эконометрика [Текст]: учебник для вузов по спец. "Мат. методы в экономике" и др. экон. спец. - М.: Дашков и К, 2010. - 448 с. - (84266-30) (У; В 15)

5. Новиков, А.И. Эконометрика [Текст]: учеб. пособие для вузов по направлению 521600 "Экономика" и экон. специальностям - М.: ИНФРА-М, 2011. - 143, с. - (86112-10) (У; Н 73)

6. Колемаев, В.А. Эконометрика [Текст]: учебник для вузов по специальности 061800 "Математические методы в экономике" / Гос. ун-т упр. - М.: ИНФРА-М, 2010. - 160 с. - (86113-10) (У; К 60)

7. Гладилин, А.В. Эконометрика [Текст]: учеб. пособие для вузов по экон. специальностям / Гладилин, А.В., Герасимов, А.Н., Громов, Е.И. - М.: КноРус, 2011. - 227 с. - (86160-10) (У; Г 52)

8. Новиков, А.И. Эконометрика [Текст]: учеб. пособие по напр. "Финансы и кредит", "Экономика" - М.: Дашков и К, 2013. - 223 с. - (93895-1) (У; Н 73)

9. Тимофеев, В.С. Эконометрика [Текст]: учебник для бакалавров по экон. напр. и спец. / Тимофеев, В.С., Фаддеенков, А.В., Щеколдин, В.Ю. - М.: Юрайт, 2013. - 328 с. - (94305-3) (У; Т 41)

10. Эконометрика [Текст]: учебник для магистров, для вузов по экон. направления и спец. / Елисеева, И.И., Курышева, С.В., Нерадовская, Ю.В., [и др.] ; под ред. И.И. Елисеевой; Санкт-Петербургский гoс. ун-т экономики и финансов - М.: Юрайт, 2012. - 449 с. - (95469-2) (У; Э 40)

11. Новиков, А.И. Эконометрика [Электронный ресурс]: учеб. пособие - М.: Дашков и К, 2013. - ЭБС Лань. - (104974-1) (У; Н 73)

12. Варюхин, А.М. Эконометрика [Текст]: конспект лекций / Варюхин, А.М., Панкина, О.Ю., Яковлева, А.В. - М.: Юрайт, 2007. - 191 с. - (105626-1) (У; В 18)

13. Эконометрика [Электронный ресурс]: учебник / Балдин, К.В., Башлыков, В.Н., Брызгалов, Н.А., [и др.] ; под ред. В.Б. Уткина - Москва: Дашков и К, 2013. - ЭБС Лань. - (107123-1) (У; Э 40)

14. Перепелица, Н.М. *Эконометрика: практикум (направление 100700.62 Торговое дело) [Электронный ресурс]: в составе учебно-методического комплекса / Тверской гос. техн. ун-т, Каф. МЕН - Тверь: ТвГТУ, 2012. - Сервер. - (107926-1)

EMBED Equation.3

Другие похожие работы, которые могут вас заинтересовать.вшм>

1589. Сравнительный анализ антивирусных программ 79.33 KB
В данной выпускной квалификационной работе рассмотрена проблема борьбы с компьютерными вирусами которой занимаются антивирусные программы. Среди набора программ используемого большинством пользователей персональных компьютеров каждый день антивирусные программы традиционно занимают особое место.
19100. Сравнительный анализ интуитивного и логического мышления 22.37 KB
Сравнительный анализ интуитивного и логического мышления. Основные теории мышления и подходы к его изучению в зарубежной и отечественной психологии. В процессе мышления человек отражает объективный мир иначе чем в процессах восприятия и воображения. В ходе самостоятельной работы будут рассмотрены основные теории мышления и подходы к его изучению в психологии.
18483. СКАЗКИ ИНДЕЙЦЕВ СЕВЕРНОЙ АМЕРИКИ: СРАВНИТЕЛЬНЫЙ АНАЛИЗ 8.39 KB
Феномен сказки является весьма загадочной темой исследования, так как устное народное творчество более других видов искусства подвержено изменениям и искажениям смысла под влиянием меняющихся факторов социокультурной среды.
18490. 115.79 KB
Ответственность государственного нотариуса при осуществлении нотариальных действий. Правовая основа деятельности частно-практикующих нотариусов на территории Республики Казахстан. Ответственность нотариуса занимающегося частной практикой. Сравнительный анализ институтов государственного и частного нотариата на территории Республики Казахстан. Судебная практика по рассмотрению дел об оспаривании действий нотариусов при осуществлении ими нотариальных...
9809. Сравнительный анализ и перспективы развития портативных компьютеров 343.85 KB
Проблемой данного исследования носит актуальный характер в современных условиях. Об этом свидетельствует частое изучение поднятых вопросов и не смотря на все обилие информации о портативных компьютеров остается непонятны их функциональные особенности, принципиальные отличия и дальней перспектива развития.
14351. ТЕНЕВАЯ ЭКОНОМИКА В СОВРЕМЕННОЙ ИНТЕРПРИТАЦИИ: СРАВНИТЕЛЬНЫЙ АНАЛИЗ 186.56 KB
Для достижения сформулированной цели ставятся следующие задачи. Во-первых, необходимо рассмотреть основные причины и предпосылки возникновения теневой экономики. Во-вторых, дать общую характеристику понятия явления теневой экономики, ее экономической природы. В-третьих, возникает необходимость провести содержательный и структурный анализ этого экономического явления
14398. СРАВНИТЕЛЬНЫЙ АНАЛИЗ ГАЗОВЫХ МЕСТОРОЖДЕНИЙ ПРИАМУДАРЬИНСКОЙ ОБЛАСТИ ТУРКМЕНИСТАНА 5.97 MB
Сравнительная характеристика газовых месторождений по отложениям верхней и средней юры. На сегодняшний день основным объектом для поисков залежей нефти и газа являются юрские и меловые отложения. Другие объекты Приамударьинской области несмотря на свою перспективность остаются в ожидании бурения и открытия месторождений нефти и газа в кайнозойских...
20554. Сравнительный анализ подходов к определению маржинальных требований для портфелей ПФИ 275.48 KB
Центральные контрагенты обслуживают рынки, нередко существенно различающиеся как по микроструктуре, так и по ассортименту финансовых инструментов с различными профилями риска: спотовые рынки с режимом исполнения T+, инструменты денежного рынка (например, сделки РЕПО), биржевые и внебиржевые производные финансовые инструменты
19049. СРАВНИТЕЛЬНЫЙ АНАЛИЗ И ОЦЕНКА ЭКСПЛУАТАЦИОННЫХ ХАРАКТЕРИСТИК БЛОКОВ ПИТАНИЯ ПК 1.04 MB
Современный блок питания представляет собой импульсный блок, а не силовой. Импульсный блок содержит в себе больше электроники и имеет свои достоинства и недостатки. К достоинствам следует отнести небольшой вес и возможность непрерывного питания при падении напряжения. К недостаткам – наличие не очень продолжительного срока службы по сравнению с силовыми блоками из-за присутствия электроники.
16100. Спрос на услуги образования в России: сравнительный эконометрический анализ 228.72 KB
Используемые данные и переменные Для анализа расходов российских домохозяйств на образовательные услуги были использованы данные регулярного выборочного микро обследования бюджетов домашних хозяйств Федеральной службы государственной статистики РФ за 2007 год. Изменение переменной произведено для устранения выбросов в выборке и получения более робастных результатов оценивания. Модели и результаты Модель Хекмана Для оценки спроса домохозяйств на образование была выбрана модель Хекмана переменные со звездочками являются ненаблюдаемыми...