Скачать 269.25 Kb.
|
На правах рукописи ПОПОВА Наталия Александровна МОДЕЛИ И АЛГОРИТМЫ ПРОБЛЕМНО-ОРИЕНТИРОВАННОЙ ИНФОРМАЦИОННО-АНАЛИТИЧЕСКОЙ СИСТЕМЫ Специальность 05.13.17 – Теоретические основы информатики Автореферат диссертации на соискание ученой степени кандидата технических наук ПЕНЗА 2013 Работа выполнена в Федеральном государственном бюджетном образовательном учреждении высшего профессионального образования «Пензенский государственный университет».
Защита диссертации состоится 21 ноября 2013 г., в 15 часов, на заседании диссертационного совета Д 212.186.01 в Федеральном государственном бюджетном образовательном учреждении высшего профессионального образования «Пензенский государственный университет» по адресу: 440026, г. Пенза, ул. Красная, 40. С диссертацией можно ознакомиться в библиотеке Федерального государственного бюджетного образовательного учреждения высшего профессионального образования «Пензенский государственный университет». Автореферат разослан «____» _______________ 2013 г. Ученый секретарь диссертационного совета Гурин Евгений Иванович ОБЩАЯ ХАРАКТЕРИСТИКА РАБОТЫ Актуальность темы. Информационно-аналитические системы (ИАС) представляют особый класс информационных систем, предназначенных для хранения, обработки и анализа данных. Эффективное хранение данных обеспечивается наличием в составе ИАС множества источников данных. Обработка и объединение данных выполняются инструментальными средствами извлечения, преобразования и загрузки данных. Анализ данных осуществляется с использованием инструментальных средств оперативного и интеллектуального анализа. ИАС, как правило, реализуются в виде надстройки над функционирующей информационной системой предприятия или организации и размещаются на различных уровнях управления. Создание ИАС предполагает большую детализацию и более сложную аналитическую обработку данных по сравнению с OLTP-системами, ориентированными на фиксацию повседневной деятельности. В связи с этим архитектура современных ИАС содержит следующие уровни: сбор и первичная обработка данных; извлечение, преобразование и загрузка данных; складирование данных; оперативное представление данных, оперативный и интеллектуальный анализ данных в процессе принятия управленческих решений. Существует два подхода к реализации ИАС. Первый подход основан на платформенно-базированных решениях, предложенных ведущими компаниями Oracle, Microsoft, CA, SAP, SAS и др. Второй подход предполагает реализацию ИАС на основе смешанного решения, при котором инструменты анализа и СУБД выбираются из числа программных продуктов различных компаний (Cognos, Business Objects и BaseGroup Labs). Преимущество второго подхода состоит в возможности обеспечения более высокой функциональной эффективности системы. Однако применение программных продуктов различных производителей затрудняет решение задач, связанных с формированием структуры транзакционной базы данных и хранилища данных, извлечением, преобразованием и загрузкой данных, разработкой моделей и алгоритмов оперативного, интеллектуального анализа данных. Как правило, большинство ИАС реализуется на основе многомерного представления данных в OLTP-(on-line transaction processing) и OLAP-(on-line analytical processing) системах. Это обусловлено требованиями сокращения временных затрат на реализацию доступа, обеспечения целостности данных. Существенный вклад в развитие модельных представлений баз и хранилищ данных для ИАС внесли: У. Г. Инмон, Э. Ф. Код, К. Дж. Дейт, Б. А. Кулик, С. Д. Кузнецов, В. И. Мунерман и др. Известны модельные представления структур данных на основе различных интерпретаций: логики классов и отношений, теоретико-множественных представлений, одноместных и многоместных предикатов, алгебры кортежей и тензорной алгебры. Впервые тензорные методы как средство формализованного описания данных были упомянуты в работе А. Е. Петрова (1976), посвященной разработке матричного представления реляционного языка баз данных. Тензорный подход применялся для проектирования банков данных и систем управления базами данных разработки информационных систем, методов анализа программ (А. Е. Арменский, 1986, 1989). Существенный вклад в развитие методов оперативного и интеллектуального анализа данных внесли: Г. Пятецкий-Шапиро, А. И. Арастумов, О. И. Ларичев, И. Д. Мандель, В. А. Дюк и др. Несмотря на значительные успехи в области создания ИАС, имеет место проблема модельных представлений данных при разработке структур хранения, процедур первичной обработки, оперативного и интеллектуального анализа данных. Первый аспект проблемы связан с недостаточной развитостью средств формализованного описания структур и процедур обработки данных на основе заданных классов объектов, отношений и измерений многомерного предметного пространства. Второй аспект проблемы связан с теоретическим обоснованием моделей анализа накопленных данных, принятия решений с учетом свойств объектов и шкал измерений многомерного пространства, третий аспект - с установлением соответствий между модельными представлениями хранения и анализа данных с функциями аналитической платформы, используемой при создании ИАС. Цель диссертационной работы – разработка и исследование модельных представлений данных на основе тензорной методологии, моделей и алгоритмов вербального анализа данных; обоснование выбора технологической платформы и системы управления базами данных. Задачи, решаемые в работе: теоретическое обоснование модельных представлений структур баз и хранилищ данных на основе построения математических моделей классов объектов и отношений между классами в предметной области с применением тензорной методологии; разработка математических моделей и алгоритмов оперативного и интеллектуального анализа данных для оценки состояний объектов в процессе деятельности с использованием средств информационно-аналитической системы; обоснование выбора технологической платформы для создания информационно-аналитической системы и разработка концептуальных моделей предметной области, отражающих ее проблемную ориентацию; разработка пилотного проекта информационно-аналитической системы на основе выбранных технологической платформы, системы управления базами данных и проведение экспериментов по оценке состояний объектов. Объектом исследования являются процессы сбора, накопления, предварительной обработки, загрузки и анализа данных при создании информационно-аналитической системы. Предметом исследования являются математические модели классов, объектов и компонент (сущностей); модели и алгоритмы обработки и анализа данных информационно-аналитической системы. Соответствие паспорту научной специальности. Область исследования соответствует п. 3 «Исследование методов и разработка средств кодирования информации в виде данных. Принципы создания языков описания данных, языков манипулирования данными, языков запросов. Разработка и исследование моделей данных и новых принципов их проектирования» и п. 5 «Разработка и исследование моделей и алгоритмов анализа данных, обнаружения закономерностей в данных и их извлечениях, разработка и исследование методов и алгоритмов анализа текста, устной речи и изображений». Методы исследования основаны на алгебре индексных объектов, теории вербального анализа решений, методах оперативного и интеллектуального анализа данных, методах концептуального моделирования в методологии ARIS, реляционном и объектно-реляционном подходах к описанию данных. Научная новизна работы: 1. Разработаны математические модели баз и хранилищ данных информационно-аналитической системы, отличающиеся заданием классов, объектов, компонентов (сущностей), базисов многомерных пространств данных в виде индексных объектов (тензоров) первой и второй валентности, что обеспечивает формализованное описание процедур преобразования, количественной оценки структур данных, операций извлечения, трансформации и загрузки данных. 2. Разработаны модель и алгоритм классификации состояний объектов управления, отличающиеся реализацией механизма цепных покрытий множества векторных оценок, предъявляемых эксперту в процессе вербального анализа данных, что позволяет строить полную и непротиворечивую классификацию средствами информационно-аналитической системы. 3. Предложена модель оценки состояния объектов управления методом сравнения с заданным экспертом эталоном, отличающаяся представлением показателей состояния в виде вектора многомерного метрического пространства, что позволяет формировать отклонения состояния по каждому показателю и интегральную оценку состояния объекта средствами информационно-аналитической системы. 4. Предложена динамическая модель изменений в распределении объектов управления по классам в виде системы дифференциальных уравнений, отличающаяся заданием параметров модели с учетом значений показателей текущего состояния объектов, что позволяет прогнозировать распределение объектов по состояниям в заданном интервале времени с использованием метода последовательных приближений. Практическая значимость исследований. Разработан пилотный проект ИАС на базе аналитической платформы Deductor, обеспечивающей сбор, предварительную обработку и анализ данных о деятельности аспирантуры вуза и информационную поддержку принятия решений по управлению процессом подготовки специалистов высшей квалификации. Тензорная интерпретация базисов многомерных пространств данных, классов и объектов, операций и отношений, процедуры классификации состояний объектов управления методом вербального анализа может быть использована при проектировании ИАС с применением концептуального и математического моделирования. Достоверность и обоснованность. Обоснованность и достоверность результатов работы определяются корректным использованием строгих и апробированных методов исследования и подтверждаются практическим применением полученных результатов при разработке ИАС на основе программных продуктов различных производителей: Deductor, Firebird и SQL Manger for InterBase and Firebird. Создание ИАС на основе базисных решений подтверждается актами внедрения и апробацией на всероссийских и международных научно-технических конференциях. Основные результаты, выносимые на защиту: 1. Математические модели баз и хранилищ данных информационно-аналитической системы на основе представления классов, объектов, компонентов (сущностей), базисов многомерных пространств данных в виде тензоров (индексных объектов) первой и второй валентности для формализованного описания процедур преобразования, количественной оценки структур данных, операций извлечения, трансформации и загрузки данных. 2. Модель и алгоритм классификации состояний объектов управления на основе механизма цепных покрытий множества векторных оценок для реализации полной и непротиворечивой классификации методом вербального анализа. 3. Модель интегральной оценки состояния и оценки отклонений состояния по каждому показателю объекта управления на основе сравнений с эталоном и представлением показателей состояния в виде вектора многомерного метрического пространства. 4. Динамическая модель, задаваемая в виде системы дифференциальных уравнений, для прогнозирования распределений объектов управления по состояниям в заданном интервале времени с использованием метода последовательных приближений. Реализация и внедрение результатов работы. Результаты диссертационного исследования использованы при разработке ИАС поддержки процесса подготовки специалистов высшей квалификации на базе аналитической платформы Deductor. Разработанная ИАС внедрена в Пензенском государственном университете, Пензенском государственном технологическом университете, Саранском филиале Российского университета кооперации, ООО «Научно-производственное предприятие “Пульс”», что подтверждается актами внедрения. Апробация работы. Основные результаты диссертации докладывались и обсуждались на следующих конференциях: «Университетское образование» (г. Пенза, 2007, 2008, 2011, 2013); «Новые информационные технологии в научных исследованиях и образовании» (г. Рязань, 2008); «Компьютерное моделирование естественно-научных и социальных проб-лем» (г. Пенза, 2008); «Информационные системы и технологии в образовании и социально-экономической сфере» (г. Королев, 2008, 2009); «Системный анализ в проектировании и управлении» (г. Санкт-Петербург, 2008, 2009); «Новые информационные технологии в образовании» (г. Екатеринбург, 2009). Публикации. По теме диссертационного исследования опубликовано 16 печатных работ: 4 статьи - в издании из перечня ВАК, 12 – в материалах российских и международных конференций. Личный вклад. Автором выполнен основной объем исследований: проведен анализ, сформулированы и решены задачи создания моделей данных, моделей и алгоритмов анализа данных, решение которых обеспечивает достижение цели и составляет новизну, практическую значимость полученных результатов. Структура и объем работы. Диссертация состоит из введения, четырех глав, заключения, списка литературы из 121 наименования и пяти приложений. Объем работы - 141 страница основного текста, включая 42 рисунка и 6 таблиц. СОДЕРЖАНИЕ РАБОТЫ Во введении обоснована актуальность темы диссертации; сформулированы цель и задачи исследования; показаны научная новизна и практическая значимость полученных результатов; приведены сведения об апробации работы и публикациях. В первой главе дан обзор существующих подходов к разработке ИАС, выполнен анализ средств формализованного описания структур и процессов обработки. Обосновано применение тензорного исчисления при формализованном описании моделей данных, процедур интеллектуального анализа данных. Приведен обзор технологий построения информационно-аналитических систем. В диссертации рассмотрен современный подход к разработке информационно-аналитических систем, основанный на разделении систем оперативной обработки транзакций, с использованием которых организуется сбор данных, и систем оперативной аналитической обработки данных, с использованием которых организуется анализ данных. Выделены основные классы ИАС хранения и анализа корпоративных данных. Представлен обзор существующих вариантов организации хранения данных ИАС, процессов извлечения, преобразования и загрузки данных. Выполнен анализ средств формализованного описания моделей данных и моделей обработки данных при ETL-процессах. Показано, что модель предметной области на основе логики классов и отношений может быть представлена с помощью нескольких интерпретаций: теоретико-множественной, логики предикатов, алгебры кортежей, тензорного исчисления. Дан обзор способов модельного представления индексных объектов: классическое тензорное исчисление; метод тензорного анализа Г. Крона; тензоры системотехники (тензорси) Г. Н. Чижухина и В. П. Панферова. Особенность метода Г. Крона состоит в использовании n-матриц для описания классов и отношений в многомерном пространстве. Подход, разработанный в области дискретной системотехники, предполагает представление объектов в виде тензорси, описывающих множество пар отношений в виде функционального графика. В результате проведенного анализа определены условия для применения тензорного исчисления при формализованном описании моделей данных. В диссертации рассмотрены методы интеллектуального анализа данных в информационно-аналитической системе. Обосновано применение метода вербального анализа данных для принятия решения в слабоструктурированных и неструктурированных предметных областях. Данные методы позволяют строить полную непротиворечивую классификацию для различных объектов, характеризуемых любыми комбинациями оценок по критериям, без преобразования качественных суждений в количественные. Проанализированы основные аналитические платформы для реализации ИАС. Обоснован выбор аналитической платформы Deductor Studio в качестве основы построения ИАС. |
Разработка информационно-аналитической модели взаимодействия системы... Разработка информационно-аналитической модели взаимодействия системы образования и | Рабочая программа элективного курса Семакин, И. Г., Хеннер, Е. К.... Учебный курс «Информационные системы и модели» предназначен для изучения в старших классах профильной школы. Курс является элективным,... | ||
Программа дисциплины «Теория и практика информационно-аналитической работы» Программа предназначена для преподавателей, ведущих данную дисциплину, учебных ассистентов и студентов направления 031600. 62 "Реклама... | Элективный курс «информационные системы и модели» И. Г. Семакин,... Учебный курс «Информационные системы и модели» предназначен для изучения в старших классах профильной школы. Курс является элективным,... | ||
Контрольная работа по курсу «Информатика» включает следующие блоки:... Используя алгоритмы перевода из одной системы счисления в другую, представить предложенные в вашем варианте числа в указанных системах... | 11. изменения и дополнения в п. Умк рабочей программы по дисциплине... В п. Умк – рабочей программы по дисциплине «Организация информационно-аналитической службы», составленной для студентов направления... | ||
Реферат на тему: Нечетко-логические модели и алгоритмы | Программа дисциплины «Информационно-библиотечные и информационно-правовые системы» Программа предназначена для преподавателей, ведущих данную дисциплину, а также студентов специальности 030900. 62 «Юриспруденция»,... | ||
Программа дисциплины «Информационно-библиотечные и информационно-правовые системы» Программа предназначена для преподавателей, ведущих данную дисциплину, а также студентов специальности 030900. 62 «Юриспруденция»,... | Математические модели и алгоритмы на графах с нестандартной достижимостью. Динамические графы Математические модели и алгоритмы на графах с нестандартной достижимостью. Динамические графы | ||
Отчет по преддипломной практике На тему: «Проектирование программного... Целью работы является проектирование программного человеко-машинного интерфейса для социально-ориентированной системы поддержки очного... | Техническое задание на создание системы аналитической отчетности Система аналитической отчетности (далее – Система) предназначена для предоставления информации о деятельности структурных бизнес-единиц... | ||
Учебно-методический комплекс образовательной профессиональной программы... Корабельные автоматизированные комплексы и информационно-управляющие системы» по дисциплине «Информационно-управляющие комплексы... | Рабочая программа дисциплины «Алгоритмы и процессоры цифровой обработки сигналов» ... | ||
Проблемно ориентированный анализ Тема научно-методической работы мо: Личностно-ориентированный подход в обучении технологии, музыке, изо и становлении самостоятельной,... | Программа по формированию навыков безопасного поведения на дорогах... Процесс информатизации современного общества обусловил необходимость разработки новой модели системы образования, основанной на применении... |