Рабочая программа обсуждена на заседании кафедры компьютерных систем «03»





Скачать 165.07 Kb.
НазваниеРабочая программа обсуждена на заседании кафедры компьютерных систем «03»
Дата публикации10.01.2015
Размер165.07 Kb.
ТипРабочая программа
100-bal.ru > Информатика > Рабочая программа


лого



МИНИСТЕРСТВО ОБРАЗОВАНИЯ И НАУКИ РОССИЙСКОЙ ФЕДЕРАЦИИ

Федеральное государственное автономное образовательное учреждение

высшего профессионального образования

«Дальневосточный федеральный университет»

(ДВФУ)
ШКОЛА ЕСТЕСТВЕННЫХ НАУК




Рабочая программа учебной дисциплины (РПУД)

Интеллектуальный анализ на основе хранилищ данных
Направление — 230700.68, Прикладная информатика
Форма подготовки  очная

Школа естественных наук

Кафедра Компьютерные системы

курс 2 семестр 3

лекции 8 час.

практические занятия 0 час.

семинарские занятия - час.

лабораторные работы 46 час.

консультации

всего часов аудиторной нагрузки 54 (час.)

самостоятельная работа 54 (час.)

реферативные работы (количество) нет

контрольные работы (количество) нет

зачет 3 семестр

экзамен - семестр
Рабочая программа составлена в соответствии с требованиями федерального государственного образовательного стандарта высшего профессионального образования (утв. приказом Минобрнауки РФ от 21.12.2009 г., № 762).

Рабочая программа обсуждена на заседании кафедры компьютерных систем « 03 » октября 2012 г.

Составитель (ли): А.М. Фролов, к.ф.-м.н., доцент

I. Рабочая программа пересмотрена на заседании кафедры:

Протокол от «_____» _________________ 20___ г. № ______

Заведующий кафедрой _______________________ Е.Л. Кулешов

(подпись) (И.О. Фамилия)


II. Рабочая программа пересмотрена на заседании кафедры:

Протокол от «_____» _________________ 20___ г. № ______

Заведующий кафедрой _______________________ Е.Л. Кулешов

(подпись) (И.О. Фамилия)
Аннотация

Учебная дисциплина разработана для студентов 2 курса направление «230700.68, «Прикладная информатика» в соответствии с требованиями ФГОС по данному направлению.

Дисциплина «Интеллектуальный анализ на основе хранилищ данных» является вариативной дисциплиной и входит в цикл общенаучных дисциплин для магистерской программы «Системы корпоративного управления».

Цель изучения дисциплины  формирование у студентов теоретических знаний, практических умений и навыков по применению современных методов интеллектуального анализа данных в различных сферах человеческой деятельности.

Задачи изучения дисциплины:

  1. изучение существующих технологий подготовки данных к анализу;

  2. изучение основных методов поиска закономерностей, связей, правил в табулированных массивах данных большого объема; иллюстрированного их применения в различных областях деятельности;

  3. овладение практическими умениями и навыками реализации технологий интеллектуального анализа данных, формирования и проверки гипотез о их природе и структуре, варьирования применяемыми моделями;

  4. формирование умений и навыков применения универсальных программных пакетов и аналитических платформ для анализа данных.

В результате изучения дисциплины студент должен:

Знать:

  • основные методы консолидации, трансформации, визуализации, оценки качества, очистки и предобработки данных;

  • принципы построения и структурную организацию хранилищ данных;

  • алгоритмы поиска ассоциативных правил и кластерного анализа;

  • статистические и машинные методы классификации и регрессии;

  • методики анализа и прогнозирования временных рядов;

  • технологию построения ансамблей и сравнения моделей;

  • возможности отечественных и зарубежных универсальных программных средств и аналитических платформ, применяемых для анализа данных;

  • проблемные вопросы внедрения аналитических программных продуктов и технологий в профессиональную деятельность организаций и учреждений.

Уметь:

  • практически применять методы консолидации, трансформации, визуализации, оценки качества, очистки и предобработки данных для качественной подготовки данных к анализу;

  • создавать хранилища данных, выполнять их загрузку, извлекать данные из хранилищ;

  • применять технологии интеллектуального анализа электронных массивов данных для решения конкретных практических проблем;

  • использовать возможности отечественных и зарубежных универсальных программных средств и аналитических платформ для поиска закономерностей, связей, правил, знаний в электронных массивах данных;

  • свободно ориентироваться на современном динамичном рынке аналитических программных продуктов.

Владеть современным инструментарием интеллектуального анализа данных.

Дисциплина направлена на формирование общекультурных и профессиональных компетенций (ОК, ПК) выпускника:

  • способен совершенствовать и развивать свой интеллектуальный и общекультурный уровень, самостоятельно обучаться новым методам исследования (ОК-1);

  • способен свободно пользоваться русским языком и одним из иностранных языков, как средством делового общения (ОК-2);

  • способен приобретать и использовать на практике знания, умения и навыки в организации исследовательских и проектных работ, в управлении коллективом (ОК-3);

  • способен проявлять инициативу, брать на себя ответственность в условиях риска и принимать нестандартные решения в проблемных ситуациях (ОК-4);

  • способен использовать углублённые знания правовых и этических норм при оценке последствий своей профессиональной деятельности, при разработке и осуществлении социально значимых проектов (ОК-5);

  • способен управлять знаниями в условиях формирования и развития информационного общества: анализировать, синтезировать и критически резюмировать и представлять информацию (ОК-6);

  • способен исследовать современные проблемы и методы прикладной информатики и научно-технического развития информационно-коммуникационных технологий (ПК-1);

  • способен исследовать закономерности становления и развития информационного общества в конкретной прикладной области (ПК-2);

  • способен на практике применять новые научные принципы и методы исследований (ПК-3);

  • способен к профессиональной эксплуатации современного электронного оборудования в соответствии с целями магистерской программы (ПК-4);

  • способен использовать и развивать методы научных исследований и инструментария в области проектирования и управления информационными системами в прикладных областях (ПК-5);

  • способен формализовывать задачи прикладной области, при решении которых возникает необходимость использования количественных и качественных оценок (ПК-6);

  • способен ставить и решать прикладные задачи в условиях неопределенности и определять методы и средства их эффективного решения (ПК-7);

  • способен проводить научные эксперименты, оценивать результаты исследований (ПК-8);

  • способен исследовать применение различных научных подходов к автоматизации информационных процессов и информатизации предприятий и организаций (ПК-9);

  • способен проводить анализ экономической эффективности ИС, оценивать проектные затраты и риски (ПК-10);

  • способен анализировать данные и оценивать требуемые знания для решения нестандартных задач с использованием математических методов и методов компьютерного моделирования (ПК-12);

  • способен анализировать и оптимизировать прикладные и информационные процессы (ПК-13);

  • способен проводить маркетинговый анализ ИКТ и вычислительного оборудования для рационального выбора инструментария автоматизации и информатизации прикладных задач (ПК-14);

  • способен применять современные методы и инструментальные средства прикладной информатики для автоматизированного решения прикладных задач различных классов и создания ИС (ПК-15);

  • способен проектировать архитектуру и сервисы информационных систем предприятий в прикладной области (ПК-16);

  • способен проектировать информационные процессы и системы с использованием инновационных инструментальных средств, адаптировать современные ИКТ к задачам прикладных ИС (ПК-17);

  • способен принимать эффективные проектные решения в условиях неопределенности и риска (ПК-18);

  • способен формировать стратегию информатизации прикладных процессов и создания прикладных ИС в соответствии со стратегией развития предприятий (ПК-19);

  • способен организовывать работы по моделированию прикладных ИС и реинжинирингу прикладных и информационных процессов предприятия (ПК-20).

  1. содержание теоретической части курса

Раздел 1. Технологии обеспечения качественного анализа данных (4 час.)

Тема 1. Технологии анализа данных, с использованием методов интерактивного/активного обучения - дискуссия (1 час.)

Аналитический и информационный походы к моделированию. Формы представления, типы и виды анализируемых данных. Источники данных для анализа. Технология KDD (Knowledge Discovery in Databases). Введение в технологию Data Mining. Программный инструментарий анализа данных.

Тема 2. Консолидация данных, с использованием методов интерактивного/активного обучения - дискуссия (1 час.)

Введение в консолидацию данных. Общая характеристика OLTP-систем. Предпосылки появления систем поддержки принятия решений (DSS – Decision Support System). Введение в хранилища данных (DW – Data Warehouse). Реляционные хранилища данных (ROLAP – Relational OLAP). Многомерные хранилища данных (MOLAP – Multidimensional OLAP). Гибридные хранилища данных (HOLAP – Hybrid OLAP). Виртуальные хранилища данных. Введение в процесс ETL (Extraction, Transformation, Loading). Извлечение данных в ETL. Преобразование данных в ETL. Загрузка данных в хранилище. Особенности загрузки данных из локальных источников. Обогащение данных.

Тема 3. Трансформация данных. Визуализация данных (1 час.)

Введение в трансформацию данных. Особенности трансформации временных рядов. Группировка и разгруппировка данных. Слияние данных. Квантование. Нормализация и кодирование данных.

Введение в визуализацию данных. Визуализаторы общего назначения. OLAP-анализ. Визуализаторы, применяемые для оценки качества моделей. Визуализаторы, применяемые для интерпретации результатов анализа.

Тема 4. Оценка качества, очистка и предобработка данных (1 час.)

Введение в оценку качества данных (ADQ – Assessment Data Quality). Технологии и методы оценки качества данных. Очистка и предобработка данных. Фильтрация данных. Обработка дубликатов и противоречий. Выявление аномальных значений. Восстановление пропущенных значений. Введение в сокращение размерности. Сокращение числа признаков. Сокращение числа значений признаков и записей. Сэмплинг.

Раздел 2. Инструменты Data mining (4 час.)

Тема 5. Поиск ассоциативных правил. Кластеризация (1 час.)

Введение в аффинитивный анализ (affinity analysis). Алгоритм a priori. Иерархические ассоциативные правила.

Введение в кластеризацию. Классификация методов кластеризации. Алгоритм кластеризации k-means. Сети Кохонена (KCN – Kohonen network). Карты Кохонена (SOM – self organizing map). Проблемы алгоритмов кластеризации

Тема 6. Классификация и регрессия. Статистические методы (1 час.)

Введение в классификацию и регрессию. Простая линейная регрессия. Оценка соответствия простой линейной регрессии реальным данным. Простая регрессионная модель. Множественная линейная регрессия. Модель множественной линейной регрессии. Регрессия с категориальными входными переменными. Методы отбора переменных в регрессионные модели. Ограничения применимости регрессионных моделей. Основы логистической регрессии. Интерпретация модели логистической регрессии. Множественная логистическая регрессия.

Тема 7. Классификация и регрессия. Машинное обучение (1 час.)

Введение в деревья решений. Алгоритмы построения деревьев решений. Алгоритмы IDЗ и С4.5. Алгоритм CART. Упрощение деревьев решений. Введение в нейронные сети. Искусственный нейрон. Принципы построения нейронных сетей. Алгоритмы обучения нейронных сетей. Алгоритм обратного распространения ошибки.

Тема 8. Анализ и прогнозирование временных рядов. Ансамбли моделей. Сравнение моделей (1 час.)

Временной ряд и его компоненты. Модели прогнозирования. Прогнозирование в торговле и логистике.

Введение в ансамбли моделей. Бэггинг. Бустинг. Альтернативные методы построения ансамблей.

Оценка эффективности и сравнение моделей. Оценка ошибки модели. Издержки ошибочной классификации. Lift- и Profit-кривые. ROC-анализ.

  1. содержание практической части курса

Лабораторные работы (46 час.)

Лабораторный практикум по разделу 1 (26 час.)

Лабораторная работа № 1 «Основы работы с аналитической платформой Deductor studio» (2 час.)

Программно-аппаратное обеспечение: ПЭВМ IBM PC (операционная система Windows XP), аналитическая платформа Deductor Studio.

Лабораторная работа № 2 «Трансформация данных в Deductor Studio» (4 час.)

Программно-аппаратное обеспечение: ПЭВМ IBM PC (операционная система Windows XP), аналитическая платформа Deductor Studio.

Лабораторная работа № 3 «Создание, заполнение и использование хранилища данных Deductor Warehouse на базе Firebird» (4 час.)

Программно-аппаратное обеспечение: ПЭВМ IBM PC (операционная система Windows XP), аналитическая платформа Deductor Studio Academic.

Лабораторная работа № 5 «Определение представления источника данных в проекте служб Analysis Services» (4 час.)

Программно-аппаратное обеспечение: ПЭВМ IBM PC (операционная система Windows XP Professional), SQL Server 2008 Developer.

Лабораторная работа № 6 «Определение и развертывание куба» (4 час.)

Место проведения: специализированный компьютерный класс.

Программно-аппаратное обеспечение: ПЭВМ IBM PC (операционная система Windows XP Professional), SQL Server 2008 Developer.

Лабораторная работа № 7 «Изменение мер, атрибутов и иерархий» (4 час.)

Программно-аппаратное обеспечение: ПЭВМ IBM PC (операционная система Windows XP Professional), SQL Server 2008 Developer.

Лабораторный практикум по разделу 2 (20 час.)

Лабораторная работа № 6. «Ассоциативные правила»  (4 час.)

Лабораторная работа № 7. «Основы работы с пакетом STATISTICА» (4 час.)

Лабораторная работа № 8. «Кластерный анализ» (4 час.)

Лабораторная работа № 9. «Регрессионный анализ» (4 час.)

Лабораторная работа № 10. «Искусственные нейронные сети» (4 час.)

  1. контроль достижения целей курса

Методы контроля:

  • обсуждение теоретических концепций;

  • представление отчетов по работам в электронной форме;

  • обсуждение промежуточных результатов по программам работ;

  • презентация, защита отчетов по лабораторным работам.

Интерактивные/активные формы проведения занятий:

  • компьютерное моделирование;

  • выполнение лабораторных работ (проектно-исследовательских работ).

Вопросы к зачету

  1. Модели и их свойства. Аналитический и информационный походы к моделированию.

  2. Формы представления, типы и виды анализируемых данных.

  3. Обучение моделей «с учителем» и «без учителя». Обучающее и тестовое множество. Ошибки обучения. Эффект переобучения.

  4. Общая схема анализа данных. Требования к алгоритмам анализа данных.

  5. Основные принципы сбора (формализации) данных. Требования к объемам анализируемых данных.

  6. Характеристика этапов технологии KDD.

  7. Data Mining. Характеристика классов задач, решаемых методами Data Mining.

  8. Программный инструментарий для выполнения анализа данных.

  9. Цели, задачи и основное содержание консолидации данных. Обобщенная схема процесса консолидации.

  10. Характеристика OLTP-систем.

  11. Предпосылки появления систем поддержки принятия решений DSS. Понятие ESS, EIS и GDSS.

  12. Основные положения концепции хранилищ данных (DW).

  13. Реляционные хранилища данных (ROLAP).

  14. Технология OLAP. Сущность многомерного представления данных.

  15. Структура многомерного куба. Работа с измерениями.

  16. Многомерные хранилища данных (MOLAP).

  17. Гибридные хранилища данных (HOLAP).

  18. Виртуальные хранилища данных.

  19. Цели, задачи и основное содержание процесса ETL.

  20. Основные виды проблем в данных, из-за которых они нуждаются в очистке.

  21. Организация процесса загрузки данных в хранилище. Постзагрузочные операции.

  22. Причины отказа от использования хранилищ данных. Особенности загрузки данных из локальных источников.

  23. Обогащение данных.

  24. Цели, задачи и основное содержание трансформации данных. Трансформация данных на разных этапах аналитического процесса. Типичные средства трансформации.

  25. Особенности трансформации временных рядов. Скользящее окно. Преобразование даты и времени.

  26. Группировка и разгруппировка данных.

  27. Способы слияния данных.

  28. Квантование данных.

  29. Нормализация и кодирование данных.

  30. Цели, задачи и основное содержание визуализации данных. Группы методов визуализации.

  31. Визуализаторы общего назначения. OLAP-анализ.

  32. Манипуляции с измерениями OLAP-куба.

  33. Визуализаторы, применяемые для оценки качества моделей.

  34. Визуализаторы, применяемые для интерпретации результатов анализа.

  35. Технологии и методы оценки качества данных. Профайлинг.

  36. Очистка и предобработка данных.

  37. Типичный набор инструментов предобработки данных в аналитическом приложении.

  38. Фильтрация данных. Обработка дубликатов и противоречий.

  39. Выявление аномальных и восстановление пропущенных значений.

  40. Алгоритмы и методы сокращения числа признаков.




  1. Учебно-методическое обеспечение дисциплины

Основная литература

  1. Паклин Н.Б., Орешков В. И. Бизнес-аналитика: от данных к знаниям. – СПб. : Питер, 2009

  2. Барсегян А.А., Куприянов М.С., Степаненко В.В., Холод И.И. Методы и модели анализа данных: OLAP и Data Mining.  2-е изд. – СПб. : БХВ – Петербург, 2008

  3. Кацко И.А., Н.Б. Паклин. Практикум по анализу данных на компьютере. – М. : КолосС, 2009.

Дополнительная литература

Темы 1 - 12

  1. Дюк В.А., Самойленко А.П. Data Mining: учебный курс. – СПб. : Питер, 2001.

  2. Хайкин С. Нейронные сети: полный курс. 2-е. изд. / Пер. с англ. – М. : Издат. дом «Вильямс», 2006.

  3. Ханк Д.Э., Уичерн Д.У., Райте А.Дж. Бизнес-прогнозирование.  7-е изд. / Пер. с англ. – М.: Издат. дом «Вильямс», 2003

  4. Дубров А. М., Мхитарян В. С., Трошин Л. И. Многомерные статистические методы : учебник. – М. : Финансы и статистика, 2000.

  5. Нейронные сети. STATISTICA Neural Network: Методология и технологии современного анализа данных. / Под ред. В.П. Боровикова. – М. : Горячая линия-Телеком, 2008

  6. Халафян А.А. STATISTICA 6. Статистический анализ данных : учебник. / - 3-е изд. – М. : Бином-Пресс, 2007.

  7. Андрейчиков А.В., Андрейчикова О.Н. Интеллектуальные информационные системы. – М. : ФиС, 2004.

  8. Кравченко Т.К., Перминов Г.И. Информационная технология процесса принятия экономических решений. - М. : ГУ-ВШЭ, 2005.

  9. Наследов А.Д. SPSS: Компьютерный анализ данных в психологии и социальных науках. / - 2-е изд. – СПб. : Питер, 2007.

Интернет-ресурсы

  1. Барсегян, А. Анализ данных и процессов. / А. Барсегян, М. Куприянов, И. Холод, М. Тесс, С. Елизаров.  3-е изд. - СПб. : БХВ-Петербург, 2010. - 512 с. - Электронное издание. - Доступно из URL : http://ibooks.ru/reading.php?productid=18456.

  2. Абдикеев, Н.М. Информационный менеджмент. / Н.М. Абдикеев. - М. : ИНФРА-М, 2009. - 400 с. - Электронное издание. - Доступно из URL : http://ibooks.ru/reading.php?productid=24489

  3. Когаловский, М.Р. Перспективные технологии информационных систем. / М.Р. Когаловский. - М. : ДМК Пресс, 2010. - 288 с. - Электронное издание. - Доступно из URL : http://ibooks.ru/reading.php?productid=22430

Добавить документ в свой блог или на сайт

Похожие:

Рабочая программа обсуждена на заседании кафедры компьютерных систем «03» iconРабочая программа по учебной дисциплине «Моделирование систем» (МС)
Рабочая программа обсуждена на заседании кафедры «Мультисервисные сети и информационная безопасность»
Рабочая программа обсуждена на заседании кафедры компьютерных систем «03» iconРабочая программа по учебной дисциплине «Основы проектирования защищенных...
Рабочая программа обсуждена на заседании кафедры «Мультисервисные сети и информационная безопасность»
Рабочая программа обсуждена на заседании кафедры компьютерных систем «03» iconРабочая программа учебной дисциплины Составитель И. А. Юмашева Оренбург...
Обсуждена на заседании кафедры «Теории управления и маркетинга» от 29 августа 2014 г., протокол №1
Рабочая программа обсуждена на заседании кафедры компьютерных систем «03» iconРабочая программа учебной дисциплины Составитель А. Г. Алятина Оренбург...
Обсуждена на заседании кафедры «Управления персоналом, туризма и сервиса» от г., протокол № …
Рабочая программа обсуждена на заседании кафедры компьютерных систем «03» iconРабочая программа обсуждена на заседании кафедры «Физика»

Рабочая программа обсуждена на заседании кафедры компьютерных систем «03» icon«Безопасность жизнедеятельности»
Рабочая программа обсуждена на заседании кафедры методики преподавания математики
Рабочая программа обсуждена на заседании кафедры компьютерных систем «03» icon«Поликлиническая педиатрия»
Рабочая учебная программа обсуждена на заседании кафедры поликлинической педиатрии
Рабочая программа обсуждена на заседании кафедры компьютерных систем «03» iconРабочая программа обсуждена на заседании кафедры «Материаловедение»
...
Рабочая программа обсуждена на заседании кафедры компьютерных систем «03» icon«лексикология»
Рабочая учебная программа обсуждена на заседании кафедры перевода и переводоведения иия ургпу
Рабочая программа обсуждена на заседании кафедры компьютерных систем «03» icon«Иностранный язык»
Рабочая учебная программа обсуждена на заседании кафедры иностранных языков Ургпу
Рабочая программа обсуждена на заседании кафедры компьютерных систем «03» iconРабочая программа дисциплины оп. 08 Теория алгоритмов (с дополнениями...
Специальность 09. 02. 03 «Программирование компьютерных систем» (базовая подготовка)
Рабочая программа обсуждена на заседании кафедры компьютерных систем «03» iconМифы о психологии и психологах
Рабочая программа обсуждена и утверждена на заседании кафедры всеобщей истории и этнографии
Рабочая программа обсуждена на заседании кафедры компьютерных систем «03» iconБбк 20 Концепции современного естествознания
Рабочая программа обсуждена на заседании кафедры экологии и экологического образования
Рабочая программа обсуждена на заседании кафедры компьютерных систем «03» icon«теория языка»
Рабочая учебная программа обсуждена на заседании кафедры перевода и переводоведения иия ургпу
Рабочая программа обсуждена на заседании кафедры компьютерных систем «03» iconПрограмма обсуждена и утверждена на заседании кафедры «Фонетики английского языка»
Программа обсуждена и утверждена на заседании кафедры «Фонетики английского языка» «27» июня 2012г. (протокол №09)
Рабочая программа обсуждена на заседании кафедры компьютерных систем «03» iconЭволюция социально-политического мифа
Рабочая программа обсуждена и утверждена на заседании кафедры всеобщей истории и этнографии


Школьные материалы


При копировании материала укажите ссылку © 2013
контакты
100-bal.ru
Поиск