Решение задач прогнозирования по результатам административного мониторинга





Скачать 122.78 Kb.
НазваниеРешение задач прогнозирования по результатам административного мониторинга
Дата публикации06.08.2013
Размер122.78 Kb.
ТипРешение
100-bal.ru > Информатика > Решение
УДК 65.011.56: 519.254
А.И. ФРОЛОВ, П.В. ЛУКЬЯНОВ

A.I. FROLOV, P.V. LUKYANOV
АНАЛИЗ СУЩЕСТВУЮЩИХ ПОДХОДОВ И МОДЕЛЕЙ, ОБЕСПЕЧИВАЮЩИХ РЕШЕНИЕ ЗАДАЧ ПРОГНОЗИРОВАНИЯ ПО РЕЗУЛЬТАТАМ АДМИНИСТРАТИВНОГО МОНИТОРИНГА

ANALYSIS OF EXISTING APPROACHES AND MODELS THAT PROVIDING SOLUTION OF THE PROBLEMS OF FORECASTING THE RESULTS OF ADMINISTRATIVE MONITORING
В статье рассматриваются существующие подходы и модели прогнозирования. Происходит отбор групп методов, которые пригодны для прогнозирования изменения состояния объекта мониторинга. Проводится анализ каждой группы методов на возможность автоматической настройки его параметров.

Ключевые слова: мониторинг, автоматическая настройка, методы прогнозирования
In article existing approaches and predictive models are considered. Is the selection of groups of methods that are useful for predicting changes in the state object of monitoring. Analysis of each of the methods in terms of the automatic adjustment of its parameters is performed.

Keywords: monitoring, automatic adjustment, methods of predicting.
ВВЕДЕНИЕ

Результаты административного мониторинга играют важнейшую роль в ходе принятия управленческих решений при реализации проектного управления в организационных, организационно-технических и социально-экономических системах [6]. Однако получаемые в результате административного мониторинга сложных систем огромные объемы данных не могут быть одновременно восприняты и осмыслены лицом, принимающим стратегические решения. Для эффективного использования полученных информационных ресурсов необходимо их преобразование в информационно-аналитические, отличающиеся более высокой степенью абстракции. То есть встает вопрос об организации интеллектуальной обработки данных, в частности одной из важнейших и сложных задач является прогнозирование состояния объекта мониторинга. В системе мониторинга выходные наборы данных представляют собой множество показателей объектов учета, значения которых фиксируются через равные промежутки времени – периоды. Поэтому выходные наборы данных мониторинга можно рассматривать как временные ряды.

Для анализа временных рядов чаще всего применяется аппарат математической статистики, что приводит к необходимости наличия у специалиста или исследователя знаний в области соответствующих методов и моделей прогнозирования, поскольку использование нерациональной модели может дать правдоподобный, но далекий от реальности результат. Это обусловлено тем, что выполнение численных операций в различных моделях не приводит к алгебраическим ошибкам и, следовательно, применение ошибочной модели зачастую незаметно. Использование статистических пакетов так же не позволяет избежать описанной проблемы, поскольку в них автоматизировано выполняются лишь вычисление по выбранной модели (алгоритму) и формальная проверка входных данных. Кроме того данные программные продукты обычно обладают сложным пользовательским интерфейсом, возможностью настройки большого количества параметров мало знакомых обычному пользователю [4].

Для прогнозирования временных рядов разработано большое количество методов или алгоритмов. Результат работы каждого алгоритма зависит от свойств прогнозируемого ряда, поэтому возникает задача автоматического или в существенной степени автоматизированного выбора наилучшего алгоритма из некоторого заданного семейства.

В статье [9] говорится, что задачу автоматического или в существенной степени автоматизированного выбора рационального метода прогнозирования для временного ряда значений показателей, полученных по результатам административного мониторинга, можно рассматривать как задачу классификации.

Для этого необходимо отобрать методы (классы), которые обеспечивают решение задачи прогнозирования по результатам административного мониторинга.

ОБЗОР МЕТОДОВ ПРОГНОЗИРОВАНИЯ

Перед тем как перейти к обзору моделей, необходимо отметить, что названия моделей и соответствующих методов как правило совпадают.

Метод прогнозирования содержит последовательность действий, в результате выполнения которой определяется модель прогнозирования конкретного временного ряда.

Моделью прогнозирования временного ряда является функциональное представление, адекватно описывающее временной ряд.

В настоящее время насчитывается свыше 100 классов моделей. Число общих классов моделей, которые в тех или иных вариациях повторяются в других, гораздо меньше. Часть моделей и соответствующих методов относится к отдельным процедурам прогнозирования. Часть методов представляет набор отдельных приемов, отличающихся от базовых или друг от друга количеством частных приемов и последовательностью их применения. [10]

В аналитическом обзоре [5] все методы прогнозирования делятся на две группы: интуитивные и формализованные.

Интуитивное прогнозирование применяется тогда, когда объект прогнозирования либо слишком прост, либо, напротив, настолько сложен, что аналитически учесть влияние внешних факторов невозможно. Интуитивные методы прогнозирования не предполагают разработку моделей прогнозирования и отражают индивидуальные суждения специалистов (экспертов) относительно перспектив развития процесса. Интуитивные методы основаны на мобилизации профессионального опыта и интуиции. Такие методы используются для анализа процессов, развитие которых либо полностью, либо частично не поддается математической формализации, то есть для которых трудно разработать адекватную модель. К таким методам относятся методы экспертных оценок, исторических аналогий, предвидения по образцу. Кроме того, в настоящее время широко распространено применение экспертных систем, в том числе с использованием нечеткой логики. [10]

Этот класс методов нельзя применять «автоматически», без анализа лицом, принимающим решения, специфики наборов данных, поэтому он в дальнейшем рассматриваться не будет.

Формализованные методы рассматривают модели прогнозирования. В обзоре [7] модели прогнозирования разделяются на статистические модели и структурные модели.

В статистических моделях функциональная зависимость между будущими и фактическими значениями временного ряда, а также внешними факторами задана аналитически. К статистическим моделям относятся следующие группы:

– регрессионные модели;

авторегрессионные модели;

модели экспоненциального сглаживания.

В структурных моделях функциональная зависимость между будущими и фактическими значениями временного ряда, а также внешними факторами задана структурно. К структурным моделям относятся следующие группы:

нейросетевые модели;

– модели на базе цепей Маркова;

– модели на базе классификационно-регрессионных деревьев.

Также к формализованным методам прогнозирования можно отнести метод «Гусеница»-SSA. Этот подход зародился в 70х-80х годах прошлого столетия. В его основе лежит трансформация ряда в матрицу и ее сингулярное разложение. После идентификации компонент сингулярного разложения происходит их группировка, приводящая к разложению исходного ряда на аддитивные компоненты, такие как тренд, колебания (периодики) и шум. В зарубежной литературе метод наиболее известен под названием SSA (Singular Spectrum Analysis), он возник из теории динамических систем [8].

Кроме того, необходимо отметить, что для узкоспециализированных задач иногда применяются особые модели прогнозирования. Так, например, для задачи прогнозирования уровня сахара крови человека применяются модели на основе дифференциальных уравнений. Для задачи прогнозирования транспортного потока, которая в последние несколько лет актуальна для мегаполисов, применяются гидродинамические модели. Для прогнозирования природных явлений, таких как землетрясения, применяется, например, модель, в основу которой положены нелинейные клетки (или соты), находящиеся под воздействием внешнего поля, и у которых есть внутреннее состояние, изменяющееся во времени под воздействием этого поля. Аналогичные модели разрабатываются и применяются для специальных процессов и систем. В рамках настоящей работы данный класс формализованных моделей не рассматривается [10].

Этот класс особых узкоспециализированных моделей прогнозирования, не подходит для решения задач прогнозирования по результатам административного мониторинга, так как их реализация будет слишком труднозатратна относительно их частоты использования.

Исходя из анализа характерных свойств наборов данных административного мониторинга [9] и приведенного выше обзора формализованные методы пригодны для прогнозирования изменения состояния объекта мониторинга или его отдельных элементов (с точки зрения специфики наборов данных), так как они рассматривают модели (количественного) прогнозирования

ВЫБОР МОДЕЛЕЙ ПРОГНОЗИРОВАНИЯ С ТОЧКИ ЗРЕНИЯ ИХ «АВТОМАТИЧЕСКОГО» ПРИМЕНЕНИЯ

Рассмотрим формализованные методы прогнозирования более подробно.

Линейная регрессионная модель. Самым простым вариантом регрессионной модели является линейная регрессия. В основу модели положено предположение, что существует дискретный внешний фактор X(t), оказывающий влияние на исследуемый процесс Z(t), при этом связь между процессом и внешним фактором линейна. Для получения прогнозных значений Z(t) в момент времени t необходимо иметь значение X(t) в тот же момент времени t, что редко выполнимо на практике.

В основу нелинейной регрессионной модели положено предположение о том, что существует известная функция, описывающая зависимость между исходным процессом Z(t) и внешним фактором X(t). Однако на практике редко встречаются процессы, для которых вид функциональной зависимости между процессом Z(t) и внешним фактором X(t) заранее известен. В связи с этим нелинейные регрессионные модели применяются редко [10].

В базовом методе «Гусеница»-SSA есть два параметра. Первый – это целое число длина гусеницы, а второй параметр является структурным – это способ группировки главных компонент. Для анализа временного ряда не имеет смысла брать длину гусеницы, большую чем половина длины ряда. Чем больше длина гусеницы тем больше детальное разложение исходного ряда. Таким образом, наиболее детальное разложение достигается при выборе длины гусеницы, приблизительно равной половине длины ряда. Маленькая дина гусеницы может привести к смешиванию интерпретируемых компонент ряда. При решение задачи выделения периодической компоненты следует выбирать длину гусеницы кратной периоду [11].

Что касается выбора второго параметра, то процедуру разделения членов сингулярного разложения на группы (шаг группировки) трудно формализовать. Эта процедура основана на анализе сингулярных векторов и собственных чисел в сингулярных разложениях [1]. Поэтому с точки зрения автоматического применения метода «Гусеница»-SSA этот параметр должен находиться перебором.

В основу экспоненциального сглаживания заложена идея постоянного пересмотра прогнозных значений по мере поступления фактических. Модель экспоненциального сглаживания присваивает экспоненциально убывающие веса наблюдениям по мере их старения. Таким образом, последние доступные наблюдения имеют большее влияние на прогнозное значение, чем старшие наблюдения. Модель Хольта-Винтерса или тройное экспоненциальное сглаживание применяется для процессов, которые имеют тренд и сезонную составляющую[10]. Эта модель из семейства моделей экспоненциального сглаживания больше всего подходит для прогнозирования изменения состояния объекта мониторинга, так учитывает наличие тренда и сезонной составляющей во временном ряде. На вход модель получает четыре параметра: α,β,γ – постоянные сглаживания, α – коэффициент сглаживания уровня, β – коэффициент сглаживания тренда, γ – коэффициент сглаживания сезонной составляющей, и четвертый параметр определяется длиной сезона исследуемого процесса.

В простом экспоненциальном сглаживании (метод Хольта) если α равно 1, то предыдущие наблюдения полностью игнорируются. Если α равно 0, то игнорируются текущие наблюдения. Значения α между 0 и 1 дают промежуточный результат[3].

Постоянные сглаживания в методе Хольта-Винтерса играют ту же роль, что и постоянная в простом экспоненциальном сглаживании. Подбираются они, например, путем перебора по этим параметрам с определенным шагом [12].

В отличие от методик прогнозирования временных рядов, основанных на экспоненциальном сглаживании, в методологии ARIMA не предполагается какой-либо четкой модели для прогнозирования данной временной серии. Задается лишь общий класс моделей, описывающих временной ряд и позволяющих выражать текущее значение переменной через ее предыдущие значения. Затем алгоритм, подстраивая внутренние параметры, сам выбирает наиболее подходящую модель прогнозирования. Общая модель, предложенная Боксом и Дженкинсом, включает как параметры авторегрессии, так и параметры скользящего среднего. Таким образом, имеется три типа параметров модели: параметры авторегрессии p, порядок разности r, параметры скользящего среднего q. В обозначениях Бокса и Дженкинса модель записывается как ARIMA (p, q, r).

Для модели ARIMA необходимо, чтобы ряд был стационарным, это означает, что его среднее постоянно, а выборочные дисперсия и автокорреляция не меняются во времени. Поэтому обычно необходимо брать разности ряда до тех пор, пока он не станет стационарным. Число разностей, которые были взяты, чтобы достичь стационарности, определяются параметром r. Для того чтобы определить необходимый порядок разности, нужно исследовать график ряда и автокоррелограмму. Сильные изменения уровня обычно требуют взятия несезонной разности первого порядка. Сильные изменения наклона требуют взятия разности второго порядка. Сезонная составляющая требует взятия соответствующей сезонной разности. Если имеется медленное убывание выборочных коэффициентов автокорреляции в зависимости от лага, обычно берут разность первого порядка [12]. На практике r необходимо определять, однако в большинстве случаев r≤2 [10].

На этапе идентификации порядка модели также необходимо решить, как много параметров авторегрессии (p) и скользящего среднего (q) должно присутствовать в эффективной модели процесса. На практике очень редко бывает, что число параметров p или q больше двух [12].

С точки зрения автоматического применения модели ARIMA для прогнозирования изменения состояния объекта мониторинга необходимо перебрать значения трех параметров в p,q,r.

В настоящее время самой популярной среди структурных моделей является модель на основе искусственных нейронных сетей. Нейронные сети состоят из нейронов. Способ связи нейронов определяет архитектуру нейронной сети. В зависимости от способа связи нейронов сети делятся на:

– однослойные нейронные сети прямого распространения;

– многослойные нейронные сети прямого распространения;

– рекуррентные нейронные сети.

При помощи нейронных сетей возможно моделирование нелинейной зависимости будущего значения временного ряда от его фактических значений и от значений внешних факторов. Нелинейная зависимость определяется структурой сети и функцией активации [10].

С точки зрения автоматического применения модели нейронных сетей для прогнозирования изменения состояния объекта мониторинга необходимо выбрать приемлемую конфигурацию сети (числа входов, выходов, скрытых слоёв, количества нейронов в скрытых слоях, задание связей), вид функции активации, что является сложной вычислительной задачей по перебору возможных структур сети. Поэтому для применения нейронных сетей необходим опыт эксперта.

По той же причине для автоматического применения не подходят модели на базе цепей Маркова и классификационно-регрессионных деревьев.

ЗАКЛЮЧЕНИЕ

В статье был проведен анализ существующих подходов и моделей, обеспечивающих решение задач прогнозирования по результатам административного мониторинга. По результатам данного анализа были выявлены прогнозные модели, которые, во-первых, пригодны для прогнозирования изменения состояния объекта мониторинга или его отдельных элементов (с точки зрения специфики наборов данных) и, во-вторых, могут обеспечивать возможность их применения «автоматически», без анализа лицом, принимающим решения, специфики наборов данных.

Примечание: исследования проводились при поддержке Российского фонда фундаментальных исследований и Правительства Орловской области, грант № 12-07-97528-р_центр_а.
СПИСОК ЛИТЕРАТУРЫ

1. Голяндина, Н.Э. Метод «Гусеница»-SSA: анализ временных рядов: Учеб. Пособие. – СПб., 2004. – 76 с.

2. Константинов, И.С. Модель хранения данных в адаптивной автоматизированной системе административного мониторинга [Текст] / И.С. Константинов, А.И. Фролов, Н.А. Кравцова // Информационные системы и технологии. – 2010. – №4(60). – С. 66-73.

3. Барсегян, А.А. Технологии анализа данных: Data Mining, Visual Mining, Text Minig, OLAP [Текст]/ А. А. Барсегян, М. С. Куприянов, В. В. Степаненко, И. И. Холод. – 2-е изд., перераб. и доп. – СПб.: БХВ-Петербург, 2007.– 384 с.: ил. CD-ROM, ISBN 5-94157-991-8.

4. Паротькин, Н.Ю. Автоматизация прогнозирования временных рядов генетическим алгоритмом [Текст] / Н.Ю. Паротькин // Молодёжь и наука: сборник материалов VII Всероссийской научно-технической конференции студентов, аспирантов и молодых ученых, посвященной 50-летию первого полета человека в космос [Электронный ресурс] /отв. ред. О.А.Краев - Красноярск : Сиб. федер. ун-т., 2011.

5. Тихонов Э.Е. Прогнозирование в условиях рынка. Невинномысск, 2006. 221 с.

6. Фролов А.И., Константинов И.С. Административный мониторинг как элемент процесса организации управления в организационно-технических системах // Управление развитием крупномасштабных систем (MLSD’2011): Материалы Пятой международной конференции (3-5 октября 2011г., Москва, Россия). Том II. – М.: ИПУ РАН, 2011. – С. 383-386.

7. Jingfei Yang M. Sc. Power System Short-term Load Forecasting: Thesis for Ph.d degree. Germany, Darmstadt, Elektrotechnik und Informationstechnik der Technischen Universitat, 2006. 139 p.

8. Александров Ф. И., Голяндина Н. Э. Выбор параметров при автоматическом выделении трендовых и периодических составляющих временного ряда в рамках подхода «Гусеница»-SSA. СПб.: Петербургский гос. ун-т. 2005.

9. Фролов А.И., Лукьянов П.В. Исследование характеристик выходных наборов
данных системы административного мониторинга в контексте автоматизации
прогнозирования состояния объекта мониторинга // Вестник компьютерных и
информационных технологий. – 2013. – № 1 – С. С. 17-21.

10. Чучуева И.А. Модель прогнозирования временных рядов по выборке максимального подобия: дис. … канд. тех. наук. Московский Государственный Технический Университет им. Н.Э. Баумана, Москва, 2012.

11. Леонтьева, Л.Н. Многомерная гусеница, выбор длины и числа компонент [Текст] / Л.Н. Леонтьева // Машинное обучение и анализ данных. – 2011. – №1. – Т. 1. – С. 2-10.

12. Резниченко Е.В., Кочегурова Е.А. Методы краткосрочного прогнозирования финансовых рынков // Известия Томского политехнического университета. – 2007. – № 6 – Т. 1 – С. 19-23.
Фролов Алексей Иванович

ФГБОУ ВПО «Госуниверситет – УНПК»

к.т.н., доцент

Зам. директора учебно-научно-исследовательского института информационных технологий по научной работе и инновациям, докторант

г. Орел, Наугорское шоссе, 40

(4862) 43-56-11

aifrolov@ostu.ru
Лукьянов Павел Вадимович

ФГБОУ ВПО «Госуниверситет – УНПК», г. Орел

младший научный сотрудник УНИЛ СПО УНИИ ИТ

г. Орел, Наугорское шоссе, 40

(4862) 76-19-10

Email: ckboji@gmail.com

Добавить документ в свой блог или на сайт

Похожие:

Решение задач прогнозирования по результатам административного мониторинга iconПрезентация «Решение задач с помощью кругов Эйлера». Презентация...
Интегрированное занятие математического кружка (математика + информатика) в 5-м классе по теме "Решение задач с помощью кругов Эйлера....
Решение задач прогнозирования по результатам административного мониторинга iconРешение задач по теме «Уравнение касательной к графику функции»
Решение задач по теме «Применение производной к исследованию функций и построению графиков»
Решение задач прогнозирования по результатам административного мониторинга iconРешение задач егэ по теме «Углы между прямыми»
Тип урока: решение задач (урок проводится в рамках уроков выделенных на подготовку к егэ.)
Решение задач прогнозирования по результатам административного мониторинга iconУрок математики в 6 классе. Проценты. Решение задач
Форма урока: решение проблемного вопроса «Жить или курить?» при помощи решения задач, урок беседа, обсуждение
Решение задач прогнозирования по результатам административного мониторинга iconОбразовательная программа творческого объединения «Иррациональные неравенства»
Сложность задач нарастает постепенно. Прежде, чем приступать к решению трудных задач, надо рассмотреть решение более простых, входящих...
Решение задач прогнозирования по результатам административного мониторинга iconКонспект урока по теме «Решение задач на механические свойства твёрдых тел.»
Гука, производить алгебраические преобразования величин и единиц измерения; самостоятельно определять порядок действий, составлять...
Решение задач прогнозирования по результатам административного мониторинга iconМетодическая разработка урока математики в 6-м классе по теме «Проценты. Решение задач»
Форма урока: решение проблемного вопроса «Жить или курить?» при помощи решения задач, урок-беседа, обсуждение
Решение задач прогнозирования по результатам административного мониторинга iconИнформационно-аналитическая справка по результатам социологического...
Костромской области. В исследовании приняли участие 1241 студентов из них: студенты спо – 374 участника (30,1% от общего количества...
Решение задач прогнозирования по результатам административного мониторинга iconУрок конференция по теме "Решение задач с помощью квадратных уравнений" 8-й класс
Решение задач с помощью квадратных уравнений”. Продолжить закрепление решение квадратных уравнений по формуле
Решение задач прогнозирования по результатам административного мониторинга iconРабочей учебной программы дисциплины «актуальные проблемы административного...
Целью изучения дисциплины является формирование совокупности теоретических знаний и практических навыков, необходимых для овладения...
Решение задач прогнозирования по результатам административного мониторинга iconМетоды социально-экономического прогнозирования
Цель изучения дисциплины «Методы социально-экономического прогнозирования» − ознакомление студентов с современными методами, подходами,...
Решение задач прогнозирования по результатам административного мониторинга iconПрограмма по формированию навыков безопасного поведения на дорогах...
«Структура органических веществ. Решение расчётных задач», в 11 классах –«Вода в жизнедеятельности человека. Решение нестандартных...
Решение задач прогнозирования по результатам административного мониторинга iconПояснительная записка Программа курса «Решение олимпиадных задач»
Программа курса «Решение олимпиадных задач» предназначена для учащихся 4-5 классов. Курс рассчитан на 35 учебных часа из расчета...
Решение задач прогнозирования по результатам административного мониторинга iconРабочая программа элективного курса по информатике «Решение прикладных задач в Excel»
В основу программы заложен курс на тему «Решение прикладных задач в Excel» из сборника элективных курсов по информатике для 9 классов...
Решение задач прогнозирования по результатам административного мониторинга iconПояснительная записка Направленность программы «Решение задач. Модуль. Проценты»
Направленность программы «Решение задач. Модуль. Проценты» по содержанию является социально-педагогической; по функциональному предназначению...
Решение задач прогнозирования по результатам административного мониторинга iconУрока по теме: «уравнения. Решение задач с помощью уравнений»
Зун учащихся по теме «Уравнения. Решение задач с помощью уравнений», навыков устных и письменных вычислений, упрощения алгебраических...


Школьные материалы


При копировании материала укажите ссылку © 2013
контакты
100-bal.ru
Поиск