ГЛАВА 2. Регрессионный анализ В данной главе будет проанализировано ценообразование на дизельное топливо на розничном рынке, а именно будет проведен первичный анализ собранных данных, а затем будет построена регрессионная модель, с помощью которой можно будет продемонстрировать зависимость цен от выбранных факторов и понять какое именно влияние оказывают эти факторы на конечную цену.
Описание собранных данных Для анализа, а в дальнейшем и для построения прогнозов, были собраны еженедельные данные с января 2008 года по декабрь 2012 по средним потребительским ценам на дизельное топливо (руб./литр), по объему выпуска дизельного топлива и бензина (тыс.тонн), а также по средним мировым ценам на нефть марки Urals (долл/баррель). Стоит отметить, что данные по объему выпуска дизельного топлива и бензина имеют пропуски, в силу того что их не удалось собрать за определенны даты. Вместе с тем, чтобы перевести цены на нефть в одну валюту с ценой на дизельное топливо, были собраны еженедельные котировки по курсу доллара с 2008 по 2012 гг. Также, были собраны месячные данные с 2008 по 2012 гг. по темпам инфляции в России. Это необходимо для того, чтобы в ходе анализа привести цены дизельного топлива одному периоду, т.к. изначальные данные по ценам на дизельное топливо уже включают в себя уровень инфляции, тогда как мировые цены на нефть инфляции не подвержены, и собранные данные по ним соответственно уровень инфляции не включают, подобное несоответствие может привести к ложным результатам при анализе данных и построении модели.
Таким образом, в исследовании будут использоваться следующие переменные ( таблица 3):
Таблица 3
Описание используемых в исследовании переменных Название
| Описание
| pricedt_wth_infl
| цена на дизельное топливо в ценах 2008 года
| price_urals_rub
| цена на нефть Urals в рублях
| quantity_ben
| объем выпуска бензина в тыс. тонн
| quantity_dt
| объем выпуска дизельного топлива в тыс. тонн
| price_dt
| средние потребительские цены на дизельное топливо с учетом инфляции
|
. Первичная обработка данных Для начала построим простой график по исходному ряду цен на дизельное топливо, чтобы посмотреть на динамику всего ряда и его линейную тенденцию (см. рис. 2)
Рис.2 Средние потребительские цены за 1литр дизельного топлива в рублях
Глядя на полученный график, можно сделать вывод о том, что резких колебаний в ценах не наблюдается, однако при этом существует довольно стремительный спад цены с середины 2008 года, и довольно резкий её скачок в январе 2011 года. Стремительный спад цены, вызван в свою очередь тем, что в первом полугодии 2008 года были установлены и поддерживались монопольно высокие цены, на что Федеральная антимонопольная служба России возбудила «первую» волну дел в отношении ВИНК и приняла меры по снижению цен. Резкий скачок цены в январе 2011 года происходит по той же причине - в течение 4 квартала 2010 года и января 2011 года были установлены и поддерживались монопольно высокие цены на дизельное топливо, на что Федеральная антимонопольная служба России возбудила уже «третью» волну дел в отношении ВИНК. Дальнейших спадов цены не последовало в силу того, что в январе 2011 года произошел рост ставок акцизов на дизельное топливо от 90 до 130%. Стоит отметить, что и в январе 2012 года также происходит рост ставок акциза на дизельное топливо от 49 до 58% 7. Таким образом, по всему ряду цен наблюдается линейная тенденция к возрастанию.
После того как цены на дизельное топливо были приведены к ценам 2008 года по вышеуказанной причине, динамика ряда сохранилась, однако уже линейной тенденции к возрастанию наблюдаться не будет (см. рис. 3).
Рис.3 Средние потребительские цены за 1 литр дизельного топлива в рублях без учета инфляции
Теперь перейдем непосредственно к анализу каждой из переменной. Для начала рассмотрим однородность каждого временного ряда и посмотрим на наличие выбросов. Для этого в эконометрическом пакете Eviews были построены ящичковые диаграммы для каждой переменной (см. рис. 4)
Рис. 4 Ящичковые диаграммы по каждой переменной
На основе этих ящичковых диаграмм можно сделать вывод о том, что только переменная, отвечающая за цены на дизельное топливо без учета инфляции, является однородной, когда остальные напротив - неоднородны. Это объясняется тем, что среднее значение переменных price_urals_rub, quantity_ben и quantity_dt не совпадает с медианой практически лежит на границах доверительного интервала, а также не находятся на одном уровне. Наличие выбросов на графике переменных quantity_ben и quantity_dt это, скорей всего, следствие достаточно большого количества пропущенных данных в этих переменных, являющихся в свою очередь, результатом того, что собрать все наблюдения за выбранный промежуток не представилось возможным.
Далее, перед тем как начать построение регрессионной модели, необходимо выяснить, не свойственно ли будет для неё наличие мультиколлинеарности. Поэтому построим корреляционную матрицу, куда включим все имеющиеся переменные (см. табл.4) Таблица 4
Корреляционная матрица Covariance Analysis: Ordinary
|
|
| Sample: 1/07/2008 12/24/2012
|
|
| Included observations: 139
|
|
| Balanced sample (listwise missing value deletion)
|
|
|
|
|
|
|
|
|
|
|
| Correlation
|
|
|
| t-Statistic
|
|
|
| Probability
| PRICEDT_WTH_INFL
| PRICE_URALS_RUB
| QUANTITY_BEN
| QUANTITY_DT
| PRICEDT_WTH_INFL
| 1.000000
|
|
|
|
| -----
|
|
|
|
| -----
|
|
|
|
|
|
|
|
| PRICE_URALS_RUB
| 0.313333
| 1.000000
|
|
|
| 3.861942
| -----
|
|
|
| 0.0002
| -----
|
|
|
|
|
|
|
| QUANTITY_BEN
| 0.176311
| 0.236754
| 1.000000
|
|
| 2.096510
| 2.852226
| -----
|
|
| 0.0379
| 0.0050
| -----
|
|
|
|
|
|
| QUANTITY_DT
| 0.116809
| 0.077574
| 0.797549
| 1.000000
|
| 1.376640
| 0.910729
| 15.47453
| -----
|
| 0.1709
| 0.3640
| 0.0000
| -----
|
|
|
|
|
|
|
|
|
|
|
Из полученных результатов видно, что высокое значение корреляции, а именно 0,79 наблюдается между переменными quantity_ben и quantity_dt, данное высокое значение не было особо ожидаемым, однако возможно это связано с тем, что оба показателя растут во времени под влиянием каких-то других факторов.
Несмотря на то, что ещё в теоритической части было сказано о том, что между мировыми ценами на нефть и ценами на дизельное топливо существует тесная взаимосвязь, здесь это взаимосвязь статистически не подтверждается, т.к. в анализе используются цены на дизельное топлива без учета инфляции .Однако, если рассчитать коэффициент корреляции в пакете Excel для мировых цен на нефть и цен на дизель с учетом инфляции, то получаем значение этого коэффициента равным 0,78, что подтверждает вышеуказанную взаимосвязь между ценами.
Также интересно посмотреть графически взаимосвязь между зависимой и каждой из объясняющих переменных (см. рис.5). Рис.5 Точечные диаграммы зависимой переменной с каждой из объясняющих
Во всех случаях отчетливо видно, что связь между зависимой и объясняющими переменными нелинейна, и наиболее интересная форма зависимости изображена на графике точечной диаграммы между переменными price_urals_rub и pricedt_wth_infl, она представляет собой некий почти замкнутый круг. Это говорит о том, что происходят изменения в связях между ценами на нефть и дизельным топливом. Возможно, это вызвано влиянием каких-то других факторов, которые не смогли учесть: смена стандартов и марок дизельного топлива, изменение в ценах нефти в связи с изменением структуры рынка энергоносителей и т.д.
Теперь проведем для каждой переменной тесты на единичные корни и построим коррелограммы, так как имеем дело с временными рядами, а значит, возможно, что ряды нестационарны и в них имеется автокоррелляция. В дальнейшем при построении модель это будет необходимо учесть.
Для начала был проведен тест Дики-Фулера на наличие единичного корня для исходного ряда по каждой переменной (см. приложение 1). Результаты теста говорят о том, что нулевая гипотеза о наличии единичного корня, не отвергается для переменных price_urals_rub и pricedt_wth_infl, т.к. остаточные вероятности больше 0,05, а значит можно сделать вывод о том что исходные ряды нестационарны. Для переменных же quantity_ben и quantity_dt нулевая гипотеза отвергается, prob<0,05 – исходные временные ряды стационарны. Тогда проведем ADF тест для переменных price_urals_rub и pricedt_wth_infl уже не по исходным рядам, а по их первым разностям (см. табл.5 и табл.6).
Таблица 5
Тест Дики-Фулера для первых разностей ряда pricedt_wth_infl
Null Hypothesis: D(PRICEDT_WTH_INFL) has a unit root
| Exogenous: Constant
|
|
| Lag Length: 1 (Automatic based on SIC, MAXLAG=15)
|
|
|
|
|
|
|
|
|
|
|
|
|
| t-Statistic
| Prob.*
|
|
|
|
|
|
|
|
|
|
| Augmented Dickey-Fuller test statistic
| -5.354498
| 0.0000
| Test critical values:
| 1% level
|
| -3.455685
|
|
| 5% level
|
| -2.872586
|
|
| 10% level
|
| -2.572730
|
|
|
|
|
|
|
|
|
|
|
| *MacKinnon (1996) one-sided p-values.
|
| Таблица 6
Тест Дики-Фулера для первых разностей ряда price_urals_rub
Null Hypothesis: D(PRICE_URALS_RUB) has a unit root
| Exogenous: Constant
|
|
| Lag Length: 0 (Automatic based on SIC, MAXLAG=15)
|
|
|
|
|
|
|
|
|
|
|
|
|
| t-Statistic
| Prob.*
|
|
|
|
|
|
|
|
|
|
| Augmented Dickey-Fuller test statistic
| -16.11460
| 0.0000
| Test critical values:
| 1% level
|
| -3.455585
|
|
| 5% level
|
| -2.872542
|
|
| 10% level
|
| -2.572707
|
|
|
|
|
|
|
|
|
|
|
| *MacKinnon (1996) one-sided p-values.
|
| Опираясь на результаты теста, можно сказать о том, что для данных рядов, взятых по первым разностям, нулевая гипотеза о наличии единичного корня отвергается, на что указывает значение prob<0,05 в обоих случаях, а значит, они стационарны.
Проанализировав ряды на стационарность, можно построить корреллограммы для каждой переменной, при этом стоит отметить, что коррелограммы будут строиться также по первым разностям, т.к. при таком условии ряды стационарны. В результате на основе полученных коррелограмм можно утверждать, что автокорреляция наблюдается у рядов pricedt_wth_infl и quantity_dt (см. приложение 2). Этому свидетельствуют явно выбивающиеся за границы интервалов лаги на графиках AC и PAC, а также значение остаточной вероятности Q-статистики меньшей 0,05. В случае же коррелограмм построенных для временных рядов price_urals_rub и quantity_ben их результаты демонстрируют отсутствие автокорреляции в них.
Таким образом, проанализировав собранные данные по основным моментам, а именно проанализировав однородность, проведя тесты на стационарность и продиагностировав каждый из рядов на наличие автокорелляции, можно переходить непосредственно к построению регрессионной модели.
|