Скачать 165.07 Kb.
|
МИНИСТЕРСТВО ОБРАЗОВАНИЯ И НАУКИ РОССИЙСКОЙ ФЕДЕРАЦИИ Федеральное государственное автономное образовательное учреждение высшего профессионального образования «Дальневосточный федеральный университет» (ДВФУ) ШКОЛА ЕСТЕСТВЕННЫХ НАУК Рабочая программа учебной дисциплины (РПУД) Интеллектуальный анализ на основе хранилищ данных Направление — 230700.68, Прикладная информатикаФорма подготовки очнаяШкола естественных наук Кафедра Компьютерные системы курс 2 семестр 3 лекции 8 час. практические занятия 0 час. семинарские занятия - час. лабораторные работы 46 час. консультации всего часов аудиторной нагрузки 54 (час.) самостоятельная работа 54 (час.) реферативные работы (количество) нет контрольные работы (количество) нет зачет 3 семестр экзамен - семестр Рабочая программа составлена в соответствии с требованиями федерального государственного образовательного стандарта высшего профессионального образования (утв. приказом Минобрнауки РФ от 21.12.2009 г., № 762). Рабочая программа обсуждена на заседании кафедры компьютерных систем « 03 » октября 2012 г. Составитель (ли): А.М. Фролов, к.ф.-м.н., доцент I. Рабочая программа пересмотрена на заседании кафедры: Протокол от «_____» _________________ 20___ г. № ______ Заведующий кафедрой _______________________ Е.Л. Кулешов (подпись) (И.О. Фамилия) II. Рабочая программа пересмотрена на заседании кафедры: Протокол от «_____» _________________ 20___ г. № ______ Заведующий кафедрой _______________________ Е.Л. Кулешов (подпись) (И.О. Фамилия) Аннотация Учебная дисциплина разработана для студентов 2 курса направление «230700.68, «Прикладная информатика» в соответствии с требованиями ФГОС по данному направлению. Дисциплина «Интеллектуальный анализ на основе хранилищ данных» является вариативной дисциплиной и входит в цикл общенаучных дисциплин для магистерской программы «Системы корпоративного управления». Цель изучения дисциплины формирование у студентов теоретических знаний, практических умений и навыков по применению современных методов интеллектуального анализа данных в различных сферах человеческой деятельности. Задачи изучения дисциплины:
В результате изучения дисциплины студент должен: Знать:
Уметь:
Владеть современным инструментарием интеллектуального анализа данных. Дисциплина направлена на формирование общекультурных и профессиональных компетенций (ОК, ПК) выпускника:
Раздел 1. Технологии обеспечения качественного анализа данных (4 час.) Тема 1. Технологии анализа данных, с использованием методов интерактивного/активного обучения - дискуссия (1 час.) Аналитический и информационный походы к моделированию. Формы представления, типы и виды анализируемых данных. Источники данных для анализа. Технология KDD (Knowledge Discovery in Databases). Введение в технологию Data Mining. Программный инструментарий анализа данных. Тема 2. Консолидация данных, с использованием методов интерактивного/активного обучения - дискуссия (1 час.) Введение в консолидацию данных. Общая характеристика OLTP-систем. Предпосылки появления систем поддержки принятия решений (DSS – Decision Support System). Введение в хранилища данных (DW – Data Warehouse). Реляционные хранилища данных (ROLAP – Relational OLAP). Многомерные хранилища данных (MOLAP – Multidimensional OLAP). Гибридные хранилища данных (HOLAP – Hybrid OLAP). Виртуальные хранилища данных. Введение в процесс ETL (Extraction, Transformation, Loading). Извлечение данных в ETL. Преобразование данных в ETL. Загрузка данных в хранилище. Особенности загрузки данных из локальных источников. Обогащение данных. Тема 3. Трансформация данных. Визуализация данных (1 час.) Введение в трансформацию данных. Особенности трансформации временных рядов. Группировка и разгруппировка данных. Слияние данных. Квантование. Нормализация и кодирование данных. Введение в визуализацию данных. Визуализаторы общего назначения. OLAP-анализ. Визуализаторы, применяемые для оценки качества моделей. Визуализаторы, применяемые для интерпретации результатов анализа. Тема 4. Оценка качества, очистка и предобработка данных (1 час.) Введение в оценку качества данных (ADQ – Assessment Data Quality). Технологии и методы оценки качества данных. Очистка и предобработка данных. Фильтрация данных. Обработка дубликатов и противоречий. Выявление аномальных значений. Восстановление пропущенных значений. Введение в сокращение размерности. Сокращение числа признаков. Сокращение числа значений признаков и записей. Сэмплинг. Раздел 2. Инструменты Data mining (4 час.) Тема 5. Поиск ассоциативных правил. Кластеризация (1 час.) Введение в аффинитивный анализ (affinity analysis). Алгоритм a priori. Иерархические ассоциативные правила. Введение в кластеризацию. Классификация методов кластеризации. Алгоритм кластеризации k-means. Сети Кохонена (KCN – Kohonen network). Карты Кохонена (SOM – self organizing map). Проблемы алгоритмов кластеризации Тема 6. Классификация и регрессия. Статистические методы (1 час.) Введение в классификацию и регрессию. Простая линейная регрессия. Оценка соответствия простой линейной регрессии реальным данным. Простая регрессионная модель. Множественная линейная регрессия. Модель множественной линейной регрессии. Регрессия с категориальными входными переменными. Методы отбора переменных в регрессионные модели. Ограничения применимости регрессионных моделей. Основы логистической регрессии. Интерпретация модели логистической регрессии. Множественная логистическая регрессия. Тема 7. Классификация и регрессия. Машинное обучение (1 час.) Введение в деревья решений. Алгоритмы построения деревьев решений. Алгоритмы IDЗ и С4.5. Алгоритм CART. Упрощение деревьев решений. Введение в нейронные сети. Искусственный нейрон. Принципы построения нейронных сетей. Алгоритмы обучения нейронных сетей. Алгоритм обратного распространения ошибки. Тема 8. Анализ и прогнозирование временных рядов. Ансамбли моделей. Сравнение моделей (1 час.) Временной ряд и его компоненты. Модели прогнозирования. Прогнозирование в торговле и логистике. Введение в ансамбли моделей. Бэггинг. Бустинг. Альтернативные методы построения ансамблей. Оценка эффективности и сравнение моделей. Оценка ошибки модели. Издержки ошибочной классификации. Lift- и Profit-кривые. ROC-анализ.
Лабораторные работы (46 час.) Лабораторный практикум по разделу 1 (26 час.) Лабораторная работа № 1 «Основы работы с аналитической платформой Deductor studio» (2 час.) Программно-аппаратное обеспечение: ПЭВМ IBM PC (операционная система Windows XP), аналитическая платформа Deductor Studio. Лабораторная работа № 2 «Трансформация данных в Deductor Studio» (4 час.) Программно-аппаратное обеспечение: ПЭВМ IBM PC (операционная система Windows XP), аналитическая платформа Deductor Studio. Лабораторная работа № 3 «Создание, заполнение и использование хранилища данных Deductor Warehouse на базе Firebird» (4 час.) Программно-аппаратное обеспечение: ПЭВМ IBM PC (операционная система Windows XP), аналитическая платформа Deductor Studio Academic. Лабораторная работа № 5 «Определение представления источника данных в проекте служб Analysis Services» (4 час.) Программно-аппаратное обеспечение: ПЭВМ IBM PC (операционная система Windows XP Professional), SQL Server 2008 Developer. Лабораторная работа № 6 «Определение и развертывание куба» (4 час.) Место проведения: специализированный компьютерный класс. Программно-аппаратное обеспечение: ПЭВМ IBM PC (операционная система Windows XP Professional), SQL Server 2008 Developer. Лабораторная работа № 7 «Изменение мер, атрибутов и иерархий» (4 час.) Программно-аппаратное обеспечение: ПЭВМ IBM PC (операционная система Windows XP Professional), SQL Server 2008 Developer. Лабораторный практикум по разделу 2 (20 час.) Лабораторная работа № 6. «Ассоциативные правила» (4 час.) Лабораторная работа № 7. «Основы работы с пакетом STATISTICА» (4 час.) Лабораторная работа № 8. «Кластерный анализ» (4 час.) Лабораторная работа № 9. «Регрессионный анализ» (4 час.) Лабораторная работа № 10. «Искусственные нейронные сети» (4 час.)
Методы контроля:
Интерактивные/активные формы проведения занятий:
Вопросы к зачету
Основная литература
Дополнительная литература Темы 1 - 12
Интернет-ресурсы
|
Рабочая программа по учебной дисциплине «Моделирование систем» (МС) Рабочая программа обсуждена на заседании кафедры «Мультисервисные сети и информационная безопасность» | Рабочая программа по учебной дисциплине «Основы проектирования защищенных... Рабочая программа обсуждена на заседании кафедры «Мультисервисные сети и информационная безопасность» | ||
Рабочая программа учебной дисциплины Составитель И. А. Юмашева Оренбург... Обсуждена на заседании кафедры «Теории управления и маркетинга» от 29 августа 2014 г., протокол №1 | Рабочая программа учебной дисциплины Составитель А. Г. Алятина Оренбург... Обсуждена на заседании кафедры «Управления персоналом, туризма и сервиса» от г., протокол № … | ||
Рабочая программа обсуждена на заседании кафедры «Физика» | «Безопасность жизнедеятельности» Рабочая программа обсуждена на заседании кафедры методики преподавания математики | ||
«Поликлиническая педиатрия» Рабочая учебная программа обсуждена на заседании кафедры поликлинической педиатрии | Рабочая программа обсуждена на заседании кафедры «Материаловедение» ... | ||
«лексикология» Рабочая учебная программа обсуждена на заседании кафедры перевода и переводоведения иия ургпу | «Иностранный язык» Рабочая учебная программа обсуждена на заседании кафедры иностранных языков Ургпу | ||
Рабочая программа дисциплины оп. 08 Теория алгоритмов (с дополнениями... Специальность 09. 02. 03 «Программирование компьютерных систем» (базовая подготовка) | Мифы о психологии и психологах Рабочая программа обсуждена и утверждена на заседании кафедры всеобщей истории и этнографии | ||
Ббк 20 Концепции современного естествознания Рабочая программа обсуждена на заседании кафедры экологии и экологического образования | «теория языка» Рабочая учебная программа обсуждена на заседании кафедры перевода и переводоведения иия ургпу | ||
Программа обсуждена и утверждена на заседании кафедры «Фонетики английского языка» Программа обсуждена и утверждена на заседании кафедры «Фонетики английского языка» «27» июня 2012г. (протокол №09) | Эволюция социально-политического мифа Рабочая программа обсуждена и утверждена на заседании кафедры всеобщей истории и этнографии |