Сглаживание рядов динамики с помощью скользящей средней. Применение сглаживания методом скользящей средней

Распространенным приемом при выявлении тенденции развития является сглаживание временного ряда. Суть различных приемов сглаживания сводится к замене фактических уровней временного ряда расчетными уровнями, которые подвержены колебаниям в меньшей степени. Это способствует более четкому проявлению тенденци и развития. Иногда сглаживание применяют как предварительный этап перед использованием других методов выделения тенденции

Скользящие средние позволяют сгладить как случайные, так и периодические колебания, выявить имеющуюся тенденцию в развитии процесса, и поэтому, являются важным инструментом при фильтрации компонент временного ряда.

Если рассматриваемое явление носит линейный характер, то применяется простая скользящая средняя. Алгоритм сглаживания по простой скользящей средней может быть представлен в виде следующей последовательности шагов:

1. Определяют длину интервала сглаживания g, включающего в себя g последовательных уровней ряда (g

2. Разбивают весь период наблюдений на участки, при этом интервал сглаживания как бы скользит по ряду с шагом, равным 1.

3. Рассчитывают арифметические средние из уровней ряда, образующих каждый участок.

4. Заменяют фактические значения ряда, стоящие в центре каждого участка, на соответствующие средние значения.

При этом удобно брать длину интервала сглаживания g в виде нечетного числа: g=2p+1, т.к. в этом случае полученные значения скользящей средней приходятся на средний член интервала.

Наблюдения, которые берутся для расчета среднего значения, называются активным участком сглаживания.

При нечетном значении g все уровни активного участка могут быть представлены в виде: yt-p, yt-p+1, ... , yt-1, yt, yt+1, ... , yt+p-1, yt+p,

а скользящая средняя определена по формуле:

Процедура сглаживания приводит к полному устранению периодических колебаний во временном ряду, если длина интервала сглаживания берется равной или кратной циклу, периоду колебаний.

Для устранения сезонных колебаний желательно было бы использовать четырех- и двенадцатичленную скользящие средние, но при этом не будет выполняться условие нечетности длины интервала сглаживания. Поэтому при четном числе уровней принято первое и последнее наблюдение на активном участке брать с половинными весами:

Тогда для сглаживания сезонных колебаний при работе с временными рядами квартальной или месячной динамики можно использовать следующие скользящие средние:

При использовании скользящей средней с длиной активного участка g=2p+1 первые и последние p уровней ряда сгладить нельзя, их значения теряются. Очевидно, что потеря значений последних точек является существенным недостатком, т.к. для исследователя последние "свежие" данные обладают наибольшей информационной ценностью. Рассмотрим один из приемов, позволяющих восстановить потерянные значения временного ряда . Для этого необходимо:

1.Вычислить средний прирост на последнем активном участке yt-p, yt-p+1, ... , yt, ... , yt+p-1, yt+p

2.Получить P сглаженных значений в конце временного ряда путем последовательного прибавления среднего абсолютного прироста к последнему сглаженному значению.

Аналогичную процедуру можно реализовать для оценивания первых уровней временного ряда.

Метод простой скользящей средней применим, если графическое изображение динамического ряда напоминает прямую. Когда тренд выравниваемого ряда имеет изгибы, и для исследователя желательно сохранить мелкие волны, применение простой скользящей средней нецелесообразно.

Если для процесса характерно нелинейное развитие, то простая скользящая средняя может привести к существенным искажениям. В этих случаях более надежным является использование взвешенной скользящей средней.

При построении взвешенной скользящей средней на каждом участке сглаживания значение центрального уровня заменяется на расчетное, определяемое по формуле средней арифметической взвешенной, т.е. уровни ряда взвешивают.

Взвешенная скользящая средняя приписывает каждому уровню вес, зависящий от удаления данного уровня до уровня, стоящего в середине участка сглаживания.

При сглаживании по взвешенной скользящей средней используются полиномы второго (парабола) или третьего порядка.

Сглаживание с помощью взвешенной скользящей средней осуществляется следующим образом: для каждого участка сглаживания подбирается полином вида:

Y i = a j + a 1 t

Y i = a o + a 1 t + a 2 t 2 +… a p t p

Параметры полинома находятся по методу наименьших квадратов.

При этом начало отсчета переносится в середину участка сглаживания, например, если длина интервалов сглаживания = 5, то индексы уровней участка сглаживания будут равны: -2, -1, 0, 1, 2.

у	t	t	t
у1	-2
у2	-1
у3
у4
у5
	t=0

Тогда сглаживающим значением для уровня, стоящего в середине участка сглаживания, будет значение параметра а 0 .

Нет необходимости каждый раз заново вычислять весовые коэффициенты при уровнях ряда, входящих в участок сглаживания, поскольку они будут одинаковыми для каждого участка сглаживания, например, если в интервал сглаживания входит 5 последующих уровней ряда и выравнивание производится по параболе, то коэффициенты параболы находят по методу наименьших квадратов, учитывая, что t = 0.

Метод наименьших квадратов в этой ситуации дает следующую систему уравнений:

Для нахождения параметра а0 используют 1 и 3 уравнение

34-=5*34а0-10*10а0

34-=а0(170-100)

а0=

Если длина интервала сглаживания равна 7, весовые коэффициенты следующие:

Отметим важные свойства приведенных весов:

1) Они симметричны относительно центрального уровня.

2) Сумма весов с учетом общего множителя, вынесенного за скобки, равна единице.

3) Наличие как положительных, так и отрицательных весов, позволяет сглаженной кривой сохранять различные изгибы кривой тренда.

Существуют приемы, позволяющие с помощью дополнительных вычислений получить сглаженные значения для Р начальных и конечных уровней ряда при длине интервала сглаживания g=2p+1.

Весовые коэффициенты при сглаживании по полиномам второго и третьего порядка

Тема 5: Методы измерения и изучения устойчивости временного ряда.

o устойчивость уровней ряда;

o устойчивость тренда.

Согласно статистической теории, статистический показатель содержит в себе элементы необходимого и случайного. Необходимость проявляется в форме тенденции временных рядов, а случайность в форме колебаний уровней относительно тренда. Тенденцией характеризуется процесс эволюции.

Расчленение временных рядов на составляющие элементы – условный описательный прием. Тем не менее, решающим фактором, обусловливающим тенденцию является целенаправленная деятельность человека, а главной причиной колеблемости – изменение условий жизнедеятельности.

Отсюда следует, что устойчивость не означает обязательного повторения одинакового уровня из года в год. Слишком узким было понятие устойчивости ряда как полное отсутствие любых колебаний уровней.

Сокращение колебаний уровней ряда – одна из главных задач при повышении устойчивости.

Устойчивость временных рядов - это наличие необходимой тенденции изучаемого показателя с минимальным влиянием на него неблагоприятных условий.

Для измерения устойчивости уровней временных рядов используют следующие показатели:

1) размах колеблемости - определяется как разница средних уровней за благоприятные и неблагоприятные по отношению к изучаемому явлению периоды времени:

R=y благопр – унеблагопр

К благоприятным периодам времени относятся все периоды с уровнями выше тренда, а к неблагоприятным – ниже тренда.

3)среднее линейное отклонение:

1) среднее квадратическое отклонение:

S(t)=

Уменьшение колеблемости во времени будет равнозначно устойчивости уровней.

Для характеристики устойчивости рекомендуются также следующие показатели:

1) процентный размах (PR):

Wmax/min – max/min относительный прирост.

2) Скользящая средняя (МА) оценивает величину среднего отклонения от уровня скользящих средних (хt):

3) Среднее процентное изменение (АРС) оценивает среднее значение абсолютных величин, относительных приростов и квадратов относительных приростов:

АРС=

Для оценки устойчивости уровней временных рядов применяются относительные показатели колеблемости:

K=100 – V(t) – коэффициент устойчивости (в процентах или долях единиц).

Для измерения устойчивости тенденции динамики (тренда) используют следующие показатели:

1) коэффициент корреляции рангов (коэффициент Спирмена):

d - разность рангов уровней изучаемого ряда и рангов номеров периодов или моментов времени.

Для определения этого коэффициента величины уровней нумеруют в порядке возрастания, а при наличии одинаковых уровней им присваивается определенный ранг равный частному от деления рангов, приходящихся на число этих равных значений.

Коэффициент Спирмена может принимать значения в пределах от 0 до ±1. Если каждый уровень исследуемого периода выше, чем предыдущего, то ранги уровней ряда и номера лет совпадают – Кр=+1. Это означает полную устойчивость самого факта роста уровней ряда, то есть непрерывность роста. Чем ближе Кр к +1, тем ближе рост уровней к непрерывному, то есть выше устойчивости роста. Если Кр=0, рост совершенно неустойчив.

При отрицательных значениях чем ближе Кр к -1, тем устойчивее уменьшение изучаемого показателя.

Индекс корреляции показывает степень сопряженности колебаний исследуемых показателей с совокупностью факторов, изменяющих их во времени. Приближение индекса корреляции к 1 означает, большую устойчивость изменения уровней временных рядов.

Число уровней ряда у двух показателей должно быть одинаково.

Применяются также комплексные показатели устойчивости , сущность которых заключается в определении их не через уровни временных рядов, а через показатели их динамики.

1. Показатель Каякиной определяется как отношение среднего прироста линейного тренда, т.е. параметра а1 к среднему квадратическому отклонению уровней от тренда:

Чем больше величина этого показателя, тем менее вероятно, что уровень ряда в следующем периоде будет меньше предыдущего.

2. Показатель опережения, который получают, сопоставляя темпы роста уровней ряда с темпами значения колеблемости:

Если показатель опережения > 1, то это свидетельствует о том, что уровни ряда в среднем растут быстрее колебаний или снижаются медленнее колебаний. В таком случае коэффициент колеблемости уровней будет уменьшаться, а коэффициент устойчивости уровней увеличиваться. Если показатель опережения меньше 1, то колебания растут быстрее уровней тренда и коэффициент колеблемости растет, а коэффициент устойчивости уровней уменьшается, то есть показатель опережения определяет направление динамики коэффициента устойчивости уровней.

Сможет найти опцию, позволяющую выбрать метод расчета. Вариантов дается три: SMA (простая), EMA (экспоненциальная) и WMA (взвешенная). Эта статья посвящена рассмотрению взвешенной скользящей средней .

В чем суть взвешенной средней?

Тогда как простая скользящая средняя есть всего лишь среднее арифметическое значений за указанное трейдером в настройках количество периодов (по умолчанию чаще всего стоит 20 периодов), взвешенная средняя учитывает, что значения последних периодов (то есть наиболее актуальные данные) важнее, чем значения первых. Особенно использование такого индикатора уместно, если на данный момент на рынке существует явно выраженная тенденция к росту или падению стоимости актива. Визуально формула вычисления WMA имеет такой вид:

Важно отметить, что экспоненциальная средняя (EMA) тоже в некоторой мере является взвешенной – принцип повышение веса показателя со временем сохраняется. Однако расчет EMA немного иной:

Популярностью среди трейдеров пользуются именно взвешенные скользящие средние – они считаются значительно более гибкими. Простая скользящая средняя – «топорный» инструмент, который чаще всего используется как составной элемент более хитроумного индикатора.

Как считается взвешенная скользящая средняя?

Для расчета используется следующая формула:

Пусть формула выглядит пугающе, но она удивительно проста: значение P – это цена актива в определенном периоде, значение W – удельный вес. Вручную посчитать взвешенную среднюю не составит труда, что мы и докажем следующим примером:

Дата	Цена актива

Необходимо определить значение взвешенной скользящей средней 6 мая за последние 5 периодов.

Подставляем значения в формулу:

Видно, что значение WMA больше, и это является отражением ярко выраженного тренда к возрастанию значений:

Естественно, в реальности за пять периодов средняя не считается, так как такой анализ дает слишком субъективный результат. Однако более массивные расчеты проводить вручную проблематично и попросту долго, поэтому можно поблагодарить компьютеры, что они делают эту работу за нас.

Преимущества и недостатки взвешенных средних

Преимущество взвешенной средней уже было проиллюстрировано – этот индикатор более гибко реагирует на последние тенденции изменений цены актива. К недостаткам же относятся следующие моменты:

Запаздывание при входе в тренд и выходе из него все равно остается довольно ощутимым, пусть и в меньшей степени, чем при использовании простых средних. Кстати, чтобы избавиться от этого недостатка рекомендуется использовать экспоненциальные индикаторы EMA, которые на данный момент считаются наиболее совершенной моделью скользящей средней.

Взвешенная средняя сильно меняется при появлении ложного сигнала (так как именно последнему сигналу уделяется особое внимание). В этом плане простая скользящая средняя более совершенна.

WMA неэффективна при позиционной торговле, так как выглядит более сглаженной из-за низкого шума рынка. Использовать такую среднюю лучше при среднесрочной и краткосрочной торговле. Какими инструментами пользоваться при торговле на больших таймфреймах, расскажет эта статья - .

Стратегия торговли на взвешенных средних

Чтобы проиллюстрировать работу скользящих средних, необходимо привести в пример одну из стратегий, которая основана на этом индикаторе – называется «Взвешенный Тейлор» (Weighted Taylor).

Условия торговли следующие:

Выбирается дневной таймфрейм - лучше, если активом является валютная EURUSD. Если запаса депозита недостаточно для торговли на таких больших таймфреймах, рисковать не стоит – следует снизить размер сделки.

Устанавливают 5 взвешенных средних с периодами 5 (голубая), 15 (оранжевая), 30 (желтая), 60 (розовая), 90 (красная). График выглядит так:

Устанавливается RSI с периодом 5 и двумя уровнями (60 и 40).

Устанавливается MACD со следующими параметрами: быстрая EMA 5, медленная EMA 13, простая SMA Также ставятся два красных уровня: 0,005 и -0,005.

Вся картинка выглядит так:

Торговать нужно следующим образом: в первую очередь обращать внимание на скользящие средние. Долгосрочные взвешенные средние имеют более сглаженный вид – как правило, когда краткосрочные пересекают их, это свидетельствует о зачатке тренда. По нашему примеру видно, что на рынке затишье, однако, голубая (самая краткосрочная) поменяла направление и стремится к розовой и красной (самым долгосрочным), поэтому трейдеру следует быть настороже.

Далее обращаем внимание на индикатор RSI. Если зеленая линия находится в коридоре 40-60, открывать позицию не рекомендуется (наш пример именно таков), потому как этот интервал характеризуется большим уровнем рыночного шума и ложных сигналов.

Индикатор MACD используется для поиска точек входа на . При этом обратить внимание стоит на «красный коридор» - принцип тот же, что и у RSI: заключать сделки нельзя . На нашем примере линия индикатора находится именно в этом коридоре.

Так, открывать позицию следует только тогда, когда все 3 индикатора дают один и тот же сигнал.

Будьте в курсе всех важных событий United Traders - подписывайтесь на наш

Это один из самых старых и широко известных способов сглаживания временного ряда. Сглаживание представляет собой некоторый способ локального усреднения данных, при котором несистематические компоненты взаимно погашают друг друга. Так, метод скользящей средней основан на переходе от начальных значений ряда к их средним значениям на интервале времени, длина которого выбрана заранее (данный интервал времени часто называют "окном"). При этом сам выбранный интервал скользит вдоль ряда.

Получаемый таким образом ряд скользящих средних ведет себя более гладко чем исходный ряд, за счет усреднения отклонений исходного ряда. Таким образом, эта процедура дает представление об общей тенденции поведения ряда. Ее применение особенно полезно для рядов с сезонными колебаниями и неясным характером тренда.

Формальное определение метода скользящей средней для окна сглаживания, длина которого выражается нечетным числом p=2m+1. Пусть имеются измерения во времени: y 1 , y 2 …y n .

Тогда метод скользящей средней состоит в том, что исходный временной ряд преобразуется в ряд сглаженных значений (оценок) по формуле:

Где р – размер окна, j – порядковый номер уровня в окне сглаживания, m – величена, определяемая по формуле: m = (p-1) / 2.

При применении метода скользящей средней выбор размера окна сглаживания p должен осуществляться исходя из соображений и привязанности к периоду сезонности для сезонных волн. Если процедура скользящего среднего используется для сглаживания не сезонных рядов, то окно выбирают равным трем, пяти или семи. Чем больше размер окна, тем более гладкий вид имеет график скользящих средних.

Задача 2. На основе данных о производстве стиральных машин фирмой за 15 месяцев 2002-2003 гг. нужно произвести сглаживание ряда методом трехчленной скользящей средней.

Стиральные машины, тыс. шт.	Трехчленные скользящие суммы	Трехчленные скользящие средние

Взяв данные за первые три месяца, исчисляем трехчленные суммы, а затем среднюю:

и т.д.

Для реализации процедуры скользящей средней можно воспользоваться функцией Microsoft Excel. В закладке "Анализ данных" выбираем "скользящее среднее". Этот режим работы служит для сглаживания уровней временного ряда на основе метода простой скользящей средней. Указывается интервал – т.е. размер окна сглаживания. По умолчанию р=3. Получаем на выходе следующий результат:

Стиральные машины, тыс. шт.	Трехчленные скользящие средние, полученные с помощью инструмента "Скользящее среднее"	Трехчленные скользящие средние, полученные выше вручную

На графике отображен исходный ряд и сглаженный. Теперь для сглаженного ряда проще и точнее можно определить основную тенденцию (например, подобрать линию тренда).

Вначале рассмотрим несколько простейших методов прогнозирования, не учитывающих наличия сезонности во временном ряде. Предположим, что в журнале РБК приведена сводка за последние 12 дней (включая сегодняшний) цен на апельсины, сложившихся на момент закрытия биржи. Используя эти данные, нужно предсказать завтрашнюю цену на какао (также на момент закрытия биржи). Рассмотрим несколько способов сделать это.

Если последнее (сегодняшнее) значение наиболее значимо по сравнению с остальными, то оно является наилучшим прогнозом на завтра.

Возможно, из-за быстрого изменения цен на бирже первые шесть значений уже устарели и не актуальны, в то время как последние шесть значимы и имеют равную ценность для прогноза. Тогда в качестве прогноза на завтра можно взять среднее последних шести значений.

Если все значения существенны, но сегодняшнее 12-е значение наиболее значимо, а предыдущие 11-е, 10-е, 9-е и т.д. имеют все меньшую и меньшую значимость, следует найти взвешенное среднее всех 12 значений. Причем весовые коэффициенты для последних значений должны быть больше, чем для предыдущих, и сумма всех весовых коэффициентов должна равняться 1.

Первый способ называется «наивным» прогнозом и достаточно очевиден. Рассмотрим подробнее остальные способы.

Метод скользящего среднего

Одним из предположений, лежащих в основе данного метода, является то, что более точный прогноз на будущее можно получить, если использовались недавние наблюдения, причем, чем «новее» данные, тем их вес для прогноза должен быть больше. Удивительно, но такой «наивный» подход оказывается чрезвычайно полезным для практики. Например, многие авиакомпании используют частный тип скользящего среднего для создания прогнозов спроса на авиаперелеты, которые, в свою очередь, используются в сложных механизмах управления и оптимизации доходов. Более того, практически все программные пакеты управления запасами содержат модули, выполняющие прогнозы на основе того или иного типа скользящего среднего.

Рассмотрим следующий пример. Маркетологу нужно спрогнозировать спрос на производимые его компанией станки. Данные по объемам продаж за последний год работы компании находятся в файле «ЛР6.Пример 1.Станки.xls».

Простое скользящее среднее . В этом методе среднее фиксированного числа N последних наблюдений используется для оценки следующего значения временно ряда. Например, используя данные о продажах станков за первые три месяца года, менеджер получает для апреля значение, используя формулу, приведённую ниже:

Менеджер вычислил объем продаж на основе простого скользящего среднего за 3 и 4 месяца. Однако требуется определить, какое количество узлов даёт более точный прогноз. Для оценки точности прогнозов используются среднее абсолютных отклонений (САО) исреднее относительных ошибок , в процентах (СООП), вычисляемые по формулам (3) и (4).

где x i –i -ое реальное значение переменной вi -й момент времени, аx ’ i –i -ое спрогнозированное значение переменной вi -й момент времени, N - количество прогнозов.

Согласно результатам, полученным на листе «Простое ск. среднее» рабочей книги «ЛР6.Пример 1.Станки.xls» (см. Рисунок 56), скользящее среднее за три месяца имеет значение САО равное 12,67 (ячейка D16 ), тогда как для скользящего среднего за 4 месяца значение САО равно 15,59 (ячейка F16 ). Тогда можно выдвинуть гипотезу, что использование большего количества статистических данных скорее ухудшает, чем улучшает точность прогноза методом скользящего среднего.

Рисунок 56. Пример 1 – результаты прогнозирования методом простого скользящего среднего

На графике (см. Рисунок 57), построенном по результатам наблюдений и прогнозов с интервалом 3 месяца, можно заметить ряд особенностей, общих для всех применений метода скользящего среднего.

Рисунок 57. Пример 1 – график кривой прогноза методом простого скользящего среднего и график реального объёма продаж

Значение прогноза, полученное методом простого скользящего среднего, всегда меньше фактического значения, если исходные данные монотонно возрастают, и больше фактического значения, если исходные данные монотонно убывают. Поэтому, если данные монотонно возрастают или убывают, то с помощью простого скользящего среднего нельзя получить точных прогнозов. Этот метод лучше всего подходит для данных с небольшими случайными отклонениями от некоторого постоянного или медленно меняющегося значения.

Основной недостаток метода простого скользящего среднего возникает в результате того, что при вычислении прогнозируемого значения самое последнее наблюдение имеет такой же вес (т. е. значимость), как и предыдущие. Это происходит потому, что вес всех N последних наблюдений, участвующих в вычислении скользящего среднего, равен 1/N. Присвоение равного веса противоречит интуитивному представлению о том, что во многих случаях последние данные могут больше сказать о том, что произойдет в ближайшем будущем, чем предыдущие.

Взвешенное скользящее среднее . Вклад различных моментов времени можно учесть, вводя вес для каждого значения показателя в скользящем интервале. В результате получается метод взвешенного скользящего среднего, который математически можно записать так:

где - вес, с которым используется показательпри расчете.

Вес - это всегда положительное число. В случае, когда все веса одинаковы, вырождается метод простого скользящего среднего.

Теперь маркетолог может использовать метод взвешенного скользящего среднего за 3 месяца. Но прежде требуется понять, как выбрать веса. Используя средство Поиск решения, можно определить оптимальный вес узлов. Чтобы определить вес узлов с помощью средства Поиск решения, при котором значение среднего абсолютных отклонений было бы минимально, выполните следующие действия:

Выберите команду Сервис -> Поиск решения.

В диалоговом окне Поиска решения установите ячейку G16 целевой (см. лист «Веса»), минимизируя её.

Изменяемыми ячейками укажите диапазон В1:В3.

Установите ограничения В4 = 1,0; В1:ВЗ ≥ 0; В1:В3 ≤ 1; B1 ≤ В2 и В2 ≤ В3.

Запустите поиск решения (результат отображает).

Рисунок 58. Пример 1 – результат поиска весов значений показателей при использовании метода взвешенного скользящего среднего

Полученные результаты показывают, что оптимальное распределение весов таково, что весь вес сосредоточен на самом последнем наблюдении, при этом значение среднего абсолютных отклонений равно 7,56 (см. также Рисунок 59). Этот результат подтверждает предположение о том, что более поздние наблюдения должны иметь больший вес.

Рисунок 59. Пример 1 – график кривой прогноза методом взвешенного скользящего среднего и график реального объёма продаж

2.3.1. Задание*

В первых двух столбцах таблицы 17 приведены данные, отражающие спрос на некоторый товар за восьмилетний период. Провести сглаживание данных методом скользящего среднего с окном сглаживания k =3.

2.3.2. Выполнение задания

Скользящее среднее вычисляется с помощью функции СРЗНАЧ. Результаты расчета представлены в третьем столбце таблицы 16 и иллюстрируются рисунком 8.

Таблица 17. Спроса на товар

2.4. Выделение трендовой и циклической компонент временного ряда**

Задание 1

В таблице 18 представлены данные об объеме y потребления энергии за четыре года (время t измеряется в кварталах). Сгладить временной ряд методом скользящего среднего, самостоятельно подобрав размер k окна сглаживания.

2.4.2. Выполнение задания 1

Из графика зависимости y (t ) (см. рис. 9) видно, что временной ряд содержит циклическую компоненту с периодом T п =4. Рассчитав с помощью функции КОРРЕЛ выборочный коэффициент автокорреляции r (1,t) (см. таблицу 19) и построив коррелограмму (с помощью мастера диаграмм – см. рис.10), получаем, что максимум коэффициента автокорреляции имеет место при значениях t, кратных четырем; это подтверждает (см. §1.2), что T п =4. Окно сглаживания следует выбрать равным (см. §1.5) периоду циклической составляющей: k=T п =4. Тогда результатом сглаживания будет являться приближенный тренд (за период положительные и отрицательные значения циклической составляющей будут компенсировать друг друга).

В третьем столбце таблицы 18 приведены результаты расчета скользящего среднего u 1 (t ) для k =4. Средняя точка t ср окна сглаживания находится между вторым и третьим моментом времени окна. Так, например, для первого окна (содержащего моменты времени t =1, 2, 3, 4) t ср =2,5; такого момента времени в наших данных нет, и мы приписываем среднее значение наблюдений по окну моменту t =2. Для второго окна t ср =3,5, и среднее значение наблюдений по второму окну будет приписано моменту t =3. Аналогично, среднее значение наблюдений для каждого следующего скользящего окна мы будем приписывать второму моменту времени этого окна.

Для установки соответствия между средним значением наблюдений по окну и серединой окна t ср необходимо применить к u 1 (t ) метод скользящего среднего с окном сглаживания, равным двум: u 2 (t )=[u 1 (t -1)+u 1 (t )]/2. Результаты расчета приведены в таблице 18 (четвертый столбец). Напомним (см. также §1.5), что расчет u 2 нужен только в случае четного k . Для нечетного k средняя точка окна сглаживания t ср совпадает с одним из имеющихся в таблице моментов времени.

Таблица 18. Расчет тренда и циклической составляющей

t	y	u 1	u 2	S 1 =y -u 2	S 2	S 3	S	T+E =Y -S	T	E
							0,581	5,419	5,902	-0,483
	4,4	6,100					-1,977	6,377	6,088	0,289
		6,400	6,250	-1,250	-1,275	-1,294	-1,294	6,294	6,275	0,019
		6,500	6,450	2,550	2,708	2,690	2,690	6,310	6,461	-0,151
	7,2	6,750	6,625	0,575	0,600	0,581	0,581	6,619	6,648	-0,029
	4,8	7,000	6,875	-2,075	-1,958	-1,977	-1,977	6,777	6,834	-0,057
		7,200	7,100	-1,100			-1,294	7,294	7,020	0,273
		7,400	7,300	2,700			2,690	7,310	7,207	0,104
		7,500	7,450	0,550			0,581	7,419	7,393	0,026
	5,6	7,750	7,625	-2,025			-1,977	7,577	7,580	-0,003
	6,4	8,000	7,875	-1,475			-1,294	7,694	7,766	-0,072
		8,250	8,125	2,875			2,690	8,310	7,952	0,358
		8,400	8,325	0,675			0,581	8,419	8,139	0,280
	6,6	8,350	8,375	-1,775			-1,977	8,577	8,325	0,252
				Сумма	0,075	0,000	-1,294	8,294	8,512	-0,218
	10,8			Среднее	0,019	0,000	2,690	8,110	8,698	-0,588

Задание 2

Вычислить значения циклической компоненты временного ряда по данным таблицы 18. Результаты записать в эту же таблицу.

2.4.4. Выполнение задания 2

Рассматриваемый временной ряд описывается аддитивной моделью, так как амплитуда колебаний уровней ряда практически не зависит от времени (см. рис. 9). По формуле (43) (учитывая, что T »u 2) рассчитываем S

Значения S 2 получены усреднением S 1 по периодам. Так как среднее значение циклической компоненты за период для аддитивной модели ряда должно равняться нулю, то выравниваем значения S 2: S 3 = S 2 -S 2 ср, где через S 2 ср обозначено среднее значение S S получены копированием S 3 по всем периодам.

Получив циклическую компоненту, вычислим следующее приближение тренда в предположении, что тренд линеен. Рассчитаем зашумленные значения тренда: T +E =Y -S (см. формулу (40)). Применив к этим значениям МНК (с помощью функции ЛИНЕЙН), получим следующую формулу: T (t )=0,186t +5,72. По этой формуле вычислим значения тренда, а затем, учитывая, что E =Y -T -S , – значения случайной компоненты E .

На рис. 9 компоненты ряда показаны графически. Так как случайная компонента существенно меньше остальных компонент ряда, можно считать, что полученные оценки тренда и циклической составляющей вполне приемлемы.

Задание 3

В первых двух столбцах таблицы 20 приведены поквартальные данные о прибыли компании (в усл. ед.) за последние четыре года. Определить трендовую, циклическую и случайную компоненты временного ряда.

2.4.6. Выполнение задания 3

Из графика зависимости y (t ) (см. рис. 11,а) видно, что временной ряд содержит циклическую компоненту с периодом T п =4. Построив коррелограмму (которая здесь не приводится), можно удостовериться, что максимум коэффициента автокорреляции имеет место при значениях t, кратных четырем; это подтверждает, что T п =4. Окно сглаживания выбираем равным (см. §1.5) периоду циклической составляющей: k=T п =4.

В третьем и четвертом столбце таблицы 20 приведены результаты расчета приближений тренда u 1 (t ) и u 2 (t ), полученные так же, как в таблице 18.

Для рассматриваемого временного ряда следует выбрать мультипликативную модель, так как амплитуда колебаний уровней ряда изменяется пропорционально тренду (см. рис. 11,а). По формуле (44) (учитывая, что T »u 2) рассчитываем S 1 – первое приближение циклической компоненты ряда.

Значения S 2 получены усреднением S 1 по периодам. Так как среднее значение циклической компоненты за период для мультипликативной модели должно равняться единице, то от S 2 переходим к следующему приближению циклической компоненты: S 3 = S 2 /S 2 ср, где S 2 ср – среднее значение S 2 . Значения циклической компоненты S получены копированием S 3 по всем периодам.

Далее вычислим следующее приближение тренда в предположении, что тренд линеен. Рассчитаем зашумленные значения тренда: TE =Y /S (см. формулу (41)). Применив к этим значениям МНК (с помощью функции ЛИНЕЙН), получим формулу для тренда: T (t )=-2,77t +90,57. По этой формуле вычислим значения тренда, а затем – значения случайной компоненты E (E =Y /(TS )). Абсолютная погрешность модели рассчитывается по формуле: Eabs =Y -TS .

На рис. 11 компоненты ряда показаны графически. Заметим, что абсолютная погрешность существенно меньше уровней ряда и тренда. Кроме того, случайная компонента практически для всех значений t близка к единице. Поэтому оценки тренда и циклической составляющей вполне приемлемы.

Таблица 20. Данные о прибыли компании

t	y	u 1	u 2	S 1	S 2	S 3	S	T *E =Y /S	T	E	Eabs
							0,914	78,804	87,792	0,898	-8,212
		81,5					1,202	83,182	85,019	0,978	-2,208
			81,25	1,108	1,088	1,082	1,082	83,153	82,245	1,011	0,982
				0,800	0,806	0,802	0,802	79,819	79,472	1,004	0,278
		76,5	77,75	0,900	0,918	0,914	0,914	76,615	76,699	0,999	-0,077
			75,75	1,215	1,208	1,202	1,202	76,527	73,926	1,035	3,127
				1,081			1,082	73,914	71,152	1,039	2,989
			71,5	0,811			0,802	72,336	68,379	1,058	3,173
			68,5	0,905			0,914	67,859	65,606	1,034	2,059
		64,5	65,75	1,217			1,202	66,545	62,833	1,059	4,463
			63,25	1,075			1,082	62,827	60,059	1,046	2,995
			59,5	0,807			0,802	59,865	57,286	1,045	2,067
		52,5	54,75	0,950			0,914	56,914	54,513	1,044	2,194
			50,25	1,194			1,202	49,909	51,740	0,965	-2,201
				Сумма	4,021		1,082	46,196	48,966	0,943	-2,998
				Среднее	1,005		0,802	37,415	46,193	0,810	-7,038

3. Задание на самостоятельную работу

1. В таблице 21* представлены данные о производительности труда Y для некоторого предприятия с 1987 по 1996 г. Получить уравнения и графики трендов: линейного, логарифмического, степенного, полиномиального, экспоненциального. Выбрать из них тренд, наиболее соответствующий наблюдениям (сравнивая значение R 2). Для выбранного тренда проверить гипотезу независимости остатков по критерию Дарбина-Уотсона (при n =10 d н =0,88 d в =1,32). Зачем надо проверять эту гипотезу?

2. В таблице 22** приведено среднее число y яиц на несушку на каждый месяц по США с 1938 по 1940 г. Требуется:

1) построить график y (t ) и коррелограмму. Анализируя их, ответить на вопросы: содержит ли ряд линейный тренд? Содержит ли ряд циклическую составляющую? Чему равен период циклической составляющей Тц? Какая модель подходит для описания ряда – аддитивная или мультипликативная?

2) определить компоненты ряда.

Таблица 22. Среднее число y яиц на несушку

3. В таблице 23 даны уровни некоторого ряда, время t измеряется в кварталах. Провести для этих данных исследования, аналогичные п.2.

Таблица 23. Уровни ряда

Практическая работа №5. Использование фиктивных
переменных при решении задач эконометрики

Теоретическая часть

Главная » Транскрипции » Сглаживание рядов динамики с помощью скользящей средней. Применение сглаживания методом скользящей средней