ГЛАВА 3. Построение прогнозов цен на дизельное топливо с помощью линейных методов Прежде чем перейти непосредственно к построению прогнозов с помощью линейных методов, стоит обратить внимание на то, что первоначально прогнозы по выбранным методам будут строиться по принципу ретропрогноза. Данный принцип заключается в том, что строится прогноз, при построении которого модель оценивается не по всем доступным наблюдениям, а лишь по части из них, при этом для оставшихся наблюдений по оцененному уравнению строится прогноз, который сравнивается с имеющимися (но не вошедшими в выборку для оценки) наблюдениями. Основная ценность ретропрогноза состоит в возможности сравнить результаты, которые дает модель, с фактическими значениями изучаемого показателя, которые не вошли в выборку, использованную для построения модели, таким образом, ретропрогноз позволяет проверить адекватность предсказания без необходимости ожидать когда наступит будущее.9 Ещё одним важным моментом ретропрогноза является то, что определение той части выборки, по которой будет строиться ретропрогноз, происходит самостоятельно по личному усмотрению исследователя. Следовательно, можно получить большое количество различных ретропрогнозов, и на их основе выбрать наилучший прогноз, соответствующий действительности. В нашем случае, будет построено не несколько ретропрогнозов по одной модели, а наоборот, несколько моделей построенных по принципу ретропрогноза и та модель, которая даст наилучший ретропрогноз будет признана пригодной и будет использоваться для прогнозирования на будущий период. Поэтому было принято решение строить ретропрогноз на промежуток с января 2012 года по декабрь 2012 применимо ко всем моделям.
Также для построения прогнозов были выбраны две модели прогнозирования: первая – модель простого экспоненциального сглаживания, а именно метод Хольта, вторая – сезонная модель авторегрессии, а именно SARIMA.
Метод Хольта Одним из самых простых методов прогнозирования является экспоненциальное сглаживание, а именно метод Брауна. Однако данный метод в общем своем виде не подходит для нашего исследования, так как он не учитывает существование тренда в данных.
Поэтому важно отметить, что существует несколько модификаций стандартного экспоненциального сглаживания и одной из таких модификаций метода Брауна является метод Хольта (иногда называется двойным экспоненциальным сглаживанием). Этот метод используется в случае, когда данные отображаются в виде тренда. Двойное экспоненциальное сглаживание чем-то напоминает простое сглаживание за исключением того факта, что в данном случае каждый период должны обновляться две компоненты: уровень и тренд ряда. Уровень представляет собой сглаженное значение данных в конце каждого периода, а тренд – сглаженное значение среднего роста в конце каждого периода. Формальная запись двойного экспоненциального сглаживания представляет собой следующую рекуррентную форму10: (3.1) где:
α – сглаживающий параметр для уровня ряда;
γ – сглаживающий параметр для тренда;
St – сглаженный уровень ряда, подсчитанный после наблюдаемого Xt, а также ожидаемая оценка данных в конце периода t в некоторых моделях;
Tt – сглаженный тренд в конце периода t;
Xt – наблюдаемое значение временного ряда в периоде t;
m – число периодов в прогнозируемом процессе освоения;
- прогноз на m периодов вперед от первоначального t;
Одно из преимуществ данного метода заключается в гибкости, которая позволяет выбирать соотношение, отслеживающее как уровень, так и наклон. При этом в методе Хольта оба значения сглаживаются непосредственно, но с использованием разных постоянных сглаживания для каждого из них.
В общем виде модель Хольта может быть представлена следующей системой уравнений:
(3.2)
где и - параметры модели, – постоянные сглаживания. В статье Brenner et al.,1968, приводится доказательство того, что значения этих постоянных сглаживания должны выбираться исходя из условия:
(3.3)
Таким образом, при оценке модели в MS Excel при помощи функции «Поиск решений», где были указаны вышеописанные условия для нахождения постоянных сглаживания, были получены следующие их значения: , .
Рассчитав параметры модели и постоянные сглаживания, были получены следующие прогнозные значения, которые представлены на графике (см. рис 7). Рис. 7 Ретропрогноз по методу Хольта
Как видно из данного графика, модель учла линейную тенденцию к возрастанию и показывает довольно неплохую аппроксимацию. Однако чтобы выяснить это, рассчитаем для полученной модели коэффициенты MAPE, которые являются средней процентной ошибкой и показывает точность метода прогнозирования. Рассчитываются они по следующим формулам: , (3.4)
где:
- действительные значения ряда,
- прогнозные.
Чем меньше данный показатель, тем лучше. В итоге, для данной модели были получены следующие значения этих коэффициентов: MAPE1= 4,47% и MAPE2=1,73% . В одном случае средняя процентная ошибка не превысила 3%, в другом случае превысила, показатель средний и неоднозначный, но в целом говорит о неплохих аппроксимационных свойствах модели.
Что же касается соотношения реальных и прогнозных значений, то здесь наблюдается некое расхождение – реальные данные первое время держатся на каком-то определенном уровне и только потом начинают возрастать, тогда как прогнозные значения демонстрируют сразу же рост. Поэтому для расчета точности полученных прогнозных значений используем коэффициент sMAPE (симметричный MAPE). Он рассчитывается не для всего ряда, а лишь для прогнозных значений по следующей формуле:
(3.5)
Данный показатель оказался равным 0.42 %. Это значение достаточно мало, что является очень хорошим показателем. Несмотря на то, что модель уловила тенденцию к возрастанию, она не смогла учесть внешнее влияние, которое удерживало цены первое время на одном уровне. Отсюда и вытекает такое расхождение предсказанных и действительных значений.
|