Программа дисциплины Анализ данных и прогнозирование для направления 080700. 62 Бизнес-информатика





Скачать 147.83 Kb.
НазваниеПрограмма дисциплины Анализ данных и прогнозирование для направления 080700. 62 Бизнес-информатика
Дата публикации10.01.2015
Размер147.83 Kb.
ТипПрограмма дисциплины
100-bal.ru > Информатика > Программа дисциплины
Правительство Российской Федерации
федеральное государственное автономное образовательное учреждение высшего профессионального образования
"Национальный исследовательский университет
"Высшая школа экономики"



Факультет бизнес - информатики

Программа дисциплины



Анализ данных и прогнозирование
для направления 080700.62 – Бизнес-информатика

Автор: П.А. Мальцев



Утверждена

Учебно-методическим Советом НИУ ВШЭ - Пермь

Председатель _____________Г.Е. Володина

«_______» ______________________20___ г.


Одобрена на заседании кафедры _________________________________

Зав.кафедрой ______________________

«_______» ________________20___ г.




Пермь, 2012г.


I. Пояснительная записка

  1. Автор программы: Мальцев Павел Андреевич.




  1. Требования к студентам: Приступая к изучению данной дисциплины, студент должен обладать знаниями информатики в объеме общеобразовательной школы, а также знаниями, полученными при изучении курсов «Базы данных», «Имитационное моделирование», «Эконометрика», «Хранилища данных».




  1. Аннотация: Цель дисциплины – дать подготовку, необходимую для успешного освоения современных методов и средств анализа данных. Полученные в результате освоения дисциплины знания необходимы при решении практических задач в сфере профессиональной деятельности, проектировании и разработке информационно-аналитических систем, систем поддержки принятия решений и других средств Business Intelligence.

Материал учебной дисциплины используется студентами в процессе работы над выпускными работами и магистерскими диссертациями, способствует дальнейшему совершенствованию информационно-коммуникационной компетенции студентов.

Задачи:

познакомить студентов с методикой анализа данных;

познакомит с современными методами анализа данных;

дать навыки применения различных методов анализа данных.

Курс призван повысить общую эрудицию студентов и расширить их практический опыт разработки ИС.


  1. Учебная задача курса:

В результате изучения курса студент должен:

Знать:

  • основные принципы и методику анализа данных;

  • основные принципы сбора и подготовки исходных данных;

  • основные принципы моделирования неопределённости;

  • основные методы анализа временных рядов;

  • основы корреляционного анализа;

  • основы дисперсионного анализа;

  • основные методы и алгоритмы интеллектуального анализа;

  • основы визуального анализа;

  • суть технологии OLAP.

Уметь:

  • применять изученные методы анализа данных при решении реальных практических задач.

Иметь представление:

  • о современном состоянии технологий и методов анализа данных;

  • о значении, областях применения и задачах решаемых Business Intelligence;

  • о тенденциях и перспективах развития средств Business Intelligence.

Обладать навыками:

  • разработки инструментальных средств анализа данных.




  1. Формы контроля:




  • текущий контроль: согласно графику контрольных мероприятий выполняется домашнее задание;

    Вид контрольного мероприятия

    Тема

    Вес контрольных точек

    Домашняя работа

    Программная реализация решения одной из задач интеллектуального анализа данных: классификация, кластеризация, поиск ассоциативных правил.

    100%

  • итоговый контроль: устное собеседование по изученному материалу;




  • итоговая оценка:

20% результирующей оценки – оценка за работу на семинарских занятиях;

40% результирующей оценки – взвешенная сумма оценок за домашние работы;

40% результирующей оценки – оценка за итоговое устное собеседование.

Таким образом, 60% результирующей оценки – это накопительная оценка и 40% – это оценка за итоговый контроль.

Результирующая оценка рассчитывается с помощью взвешенной суммы накопительной оценки и оценки за устный зачет.

Накопительная оценка рассчитывается с помощью взвешенной суммы оценок за отдельные формы текущего контроля.

Формулы расчета оценок:

О текущая = n1О1 + n2О2 + n3О3 + ∙∙∙

где Оi – оценки за контрольные мероприятия (эссе, контрольная работа, реферат и пр.)

ni – вес контрольных мероприятий (определяются преподавателем и ∑ni=1 или 100%), при этом

Веса по контрольным мероприятиям: n1 = 100% - домашняя работа.
О накопительная = k1Отекущая + k2Оаудиторная

где ki – вес текущей и аудиторной оценки, при этом k1=2/3, k2=1/3
О результирующая = q1Онакопительная + q2Оитог.контроль

где qi – вес накопительной оценки и оценки за итоговый контроль, при этом q1=0,6, q2=0,4
III. Содержание программы.
Раздел 1. Введение в анализ данных

Тема 1. Введение. Основные понятия. Пирамида знаний. Постановка задачи анализа данных. История развития технологий анализа данных.

Тема 2. Методика анализа данных. Методы сбора и подготовки исходного набора данных.

Тема 3. Моделирование неопределённости. Вероятностный подход. Условные Байесовские сети.

Раздел 2. Интеллектуальный анализ данных

Тема 4. Введение в интеллектуальный анализ данных. Задачи, решаемые методами интеллектуального анализа. Методы Data Mining. Knowledge Discovery in Databases.

Тема 5. Постановка задач классификации и регрессии. Основные алгоритмы и методы решения.

Тема 6. Постановка задач поиска ассоциативных правил и секвенциального анализа. Основные алгоритмы и методы решения.

Тема 7. Постановка задачи кластеризации. Основные алгоритмы и методы решения.
Раздел 3. Статистический анализ данных

Тема 8. Введение в анализ временных рядов. Определение и классификация временных рядов. Разложение по компонентам.

Тема 9. Выделение тренда временного ряда.

Тема 10. Тренд-сезонные экономические процессы и их анализ.

Тема 11. Корреляционный и дисперсионный анализ.
Раздел 4. Визуальный анализ данных

Тема 12. Визуальный анализ данных. Применение различных средств визуализации.
IV. Учебно-методическое обеспечение дисциплины:


  1. Литература:

Базовый учебник
  1. Барсегян А.А., Куприянов М.С., Степаненко В.В., Холод И.И. Технологии анализа данных: Data Mining, Visual Mining, Text Mining, OLAP. – Санкт-Петербург: «БХВ-Петербург», 2008

Основная

  1. Ларсон Б. Разработка Бизнес-аналитики в Microsoft SQL Server 2005. – Москва: «Питер», 2008

  2. Бергер А., Горбач И., Меломед Э., Щербин В., Степаненко В. Microsoft SQL Server 2005 Analysis Services. OLAP и многомерный анализ данных. – Санкт-Петербург: «БХВ-Петербург», 2007

Дополнительная

  1. Материалы сайта http://www.olap.ru

  2. Материалы сайта http://basegroup.ru



2. Тематика заданий по различным формам текущего контроля:
Приложение 1. Домашнее задание для проведения текущего контроля.

Приложение 2. Список вопросов для подготовки к итоговому устному собеседованию.

Приложение 3. План семинарских занятий.
3. Методические рекомендации (материалы) преподавателю:
На лекциях рекомендуется использовать мультимедийные презентации, иллюстрирующие материал. При этом студенты должны активно участвовать в обсуждении вопросов. Многие из тем курса тесно связны с уже пройденными студентами курсами: «Базы данных», «Имитационное моделирование», «Эконометрика», «Хранилища данных». Рассмотрение подобных тем следует начинать с повторения студентами того, как рассматриваемые вопросы освящались в рамках пройденных курсов.
4. Методические указания студентам:

Студентам рекомендуется следующая схема работы над практическим заданием:

1) проработать конспект лекций;

2) проанализировать рекомендованную литературу;

3) проанализировать варианты решений, предложенные преподавателем;

4) при затруднениях сформулировать вопросы к преподавателю.


  1. Рекомендации по использованию информационных технологии:


Все практические занятия проводятся в компьютерном классе. Для выполнения практических заданий студенты должны иметь доступ к следующему программному обеспечению:
MS Excel 2010

MS Visual Studio 2010

MS Development Network

MS SQL Server 2008

Автор программы __________________________Мальцев П.А.

V. Тематический расчет часов

п/п

Наименование разделов и тем

Аудиторные часы

Самостоятельная работа

Всего часов

Лекции

Семинарские или практ. занятия

Всего







Раздел 1. Введение в анализ данных

1.

Введение в анализ данных

2


0


2


4


8


2.

Методика анализа данных

2

4

6

6

18

3.

Моделирование неопределённости

2

2

4

6

14




Раздел 2. Интеллектуальный анализ данных

4.

Введение в Data Mining

2

0

2

4

8

5.

Классификация и регрессия

2

2

4

6

14

6.

Поиск ассоциативных правил и секвенциальный анализ

1

2

3

6

12

7.

Кластеризация

1

2

3

6

12




Раздел 3. Статистический анализ данных

8.

Введение в анализ временных рядов

2


0


2


4


8


9.

Выделение тренда

1

4

5

6

16

10.

Анализ тренд-сезонных временных процессов

2

4

6

6

18

11.

Корреляционный и дисперсионный анализ

2

4

6

6

18




Раздел 4. Визуальный анализ данных

12.

Визуальный анализ данных

1

0

1

4

6







Итого:

20

24

44

64

108



Автор программы __________________________ Мальцев П.А.

Приложение 1
Домашнее задание для проведения текущего контроля
Домашнее задание 1 «Программная реализация решения одной из задач интеллектуального анализа данных»
Студентам предлагается разработать программу решающую одну из задач интеллектуального анализа данных:

  • классификация;

  • поиск ассоциативных правил;

  • секвенциальный анализ;

  • кластеризация.

Студенты самостоятельно выбирает источники данных для разрабатываемой программы. Если преподаватель считает выбранные источники достаточными для успешного выполнения задания, то студент может приступать к выполнению задания. В противном случае студент должна устранить все замечания преподавателя и повторно представит тему на согласование.

После согласования темы, студентом разрабатывается программа.
Критерии оценки

Оценка программы выполняется в соответствии со следующими критериями:

  1. Соответствие представленной программы выбранной задаче интеллектуального анализа данных, отсутствие фатальных ошибок - 10 баллов.

  2. Удобность пользовательского интерфейса и адекватность выбранных средств визуализации данных – 5 баллов

  3. Корректность работы системы, отсутствие в системе не фатальных ошибок и приемлемая производительность – 5 баллов.


Приложение 2
Список вопросов для подготовки к итоговому устному собеседованию


  1. Пирамида знаний.

  2. Задача анализа данных (Постановка, история возникновения, онтология методов

  3. Методика анализа данных.

  4. Подготовка исходного набора данных.

  5. Моделирование неопределённости. Вероятностные рассуждения.

  6. Условные Байесовские сети.

  7. Интеллектуальный анализ данных (определение и классификация задач).

  8. Knowledge Discovery in Databases (KDD).

  9. Задача классификации (постановка и методы решения).

  10. Задача поиска ассоциативных правил (постановка и методы решения).

  11. Задача секвенциального анализа (постановка и методы решения).

  12. Задача кластеризации (постановка и методы решения).

  13. Оперативная аналитическая обработка (OLAP) и многомерная модель данных.

  14. Экспертные системы (определение, назначение, модели представления знаний, достоинства).

  15. Визуальный анализ данных.

  16. Задача анализа временных рядов (определение временного ряда, классификация рядов динамики, разложение по компонентам).

  17. Аномальные уровни временных рядов причины их возникновения и методы их устранения.

  18. Тренд-сезонные экономические процессы и их анализ.

  19. Задача дисперсионного анализа (постановка и методы решения).

  20. Задача корреляционного анализа (постановка и методы решения).

  21. Алгоритм Naive Bayes.

  22. Алгоритм C4.5.

  23. Алгоритм Apriori.

  24. Алгоритм C-means.

  25. Основные статистические показатели временных рядов.

  26. Метод Ирвина.

  27. Метод проверки разности средних уровней.

  28. Метод Фостера – Стюарта.

  29. Методы сглаживания временных рядов.

  30. Метод Четверикова.

  31. Основные статистические показатели временных рядов.


Приложение 3
План семинарских занятий
Тема 1. Методика анализа данных (4 часа).

Сбор эмпирических данных, очистка нормализация и трансформация данных, идентификация и поиск моделей.

Литература по теме:

  1. Барсегян А.А., Куприянов М.С., Степаненко В.В., Холод И.И. Технологии анализа данных: Data Mining, Visual Mining, Text Mining, OLAP. – Санкт-Петербург: «БХВ-Петербург», 2008.

  2. Материалы сайта http://basegroup.ru.


Тема 2. Моделирование неопределённостей (2 часа).

Основные модели моделирования неопределённостей, вероятностный подход, условные Байесовские сети.

Литература по теме:

  1. Барсегян А.А., Куприянов М.С., Степаненко В.В., Холод И.И. Технологии анализа данных: Data Mining, Visual Mining, Text Mining, OLAP. – Санкт-Петербург: «БХВ-Петербург», 2008.

  2. Материалы сайта http://basegroup.ru.



Тема 3. Задачи решаемые методами Data Mining (6 часа).

Программная реализация алгоритмов: построения 1r-првил, Naive Bayes, ID3, C4.5, Apriori, k-means, Fuzzy C-Means.

Литература по теме:

  1. Барсегян А.А., Куприянов М.С., Степаненко В.В., Холод И.И. Технологии анализа данных: Data Mining, Visual Mining, Text Mining, OLAP. – Санкт-Петербург: «БХВ-Петербург», 2008.


Тема 4. Статистический анализ данных (12 часов).

Выделение тренда Анализ тренд-сезонных временных процессов. Корреляционный и дисперсионный анализ.

Литература по теме:

  1. Барсегян А.А., Куприянов М.С., Степаненко В.В., Холод И.И. Технологии анализа данных: Data Mining, Visual Mining, Text Mining, OLAP. – Санкт-Петербург: «БХВ-Петербург», 2008.

  2. Материалы сайта http://basegroup.ru.

Добавить документ в свой блог или на сайт

Похожие:

Программа дисциплины Анализ данных и прогнозирование для направления 080700. 62 Бизнес-информатика iconРабочая программа Учебной дисциплины Анализ данных Для направления...
Программа составлена в соответствии с Федеральным государственным образовательным стандартом высшего профессионального образования...
Программа дисциплины Анализ данных и прогнозирование для направления 080700. 62 Бизнес-информатика iconРабочая программа Учебной дисциплины Базы данных Для направления...
Программа составлена в соответствии с Федеральным государственным образовательным стандартом высшего профессионального образования...
Программа дисциплины Анализ данных и прогнозирование для направления 080700. 62 Бизнес-информатика iconРабочая программа Учебной дисциплины Хранилища данных Для направления...
Программа составлена в соответствии с Федеральным государственным образовательным стандартом высшего профессионального образования...
Программа дисциплины Анализ данных и прогнозирование для направления 080700. 62 Бизнес-информатика iconПрограмма дисциплины «Базы данных» для направления 080700. 62 Бизнес-информатика...
«Базы данных» для направления 080700. 62 Бизнес-информатика подготовки бакалавра
Программа дисциплины Анализ данных и прогнозирование для направления 080700. 62 Бизнес-информатика iconРабочая программа Учебной дисциплины Объектно-ориентированный анализ...
Программа составлена в соответствии с Федеральным государственным образовательным стандартом высшего профессионального образования...
Программа дисциплины Анализ данных и прогнозирование для направления 080700. 62 Бизнес-информатика iconРабочая программа Учебной дисциплины Операционные системы Для направления...
Программа составлена в соответствии с Федеральным государственным образовательным стандартом высшего профессионального образования...
Программа дисциплины Анализ данных и прогнозирование для направления 080700. 62 Бизнес-информатика iconПрограмма дисциплины «Архитектура корпоративных информационных систем»...
«Архитектура корпоративных информационных систем» для направления 080700. 68 «Бизнес-информатика» подготовки бакалавра
Программа дисциплины Анализ данных и прогнозирование для направления 080700. 62 Бизнес-информатика iconПрограмма дисциплины «Проектирование информационных систем» для направления...
«Проектирование информационных систем» для направления 080700. 68 «Бизнес-информатика» подготовки бакалавра
Программа дисциплины Анализ данных и прогнозирование для направления 080700. 62 Бизнес-информатика iconПрограмма дисциплины «Анализ неструктурированной информации» для...
Программа предназначена для преподавателей, ведущих данную дисциплину, учебных ассистентов и студентов направления 38. 04. 05 «Бизнес-информатика»...
Программа дисциплины Анализ данных и прогнозирование для направления 080700. 62 Бизнес-информатика iconПрограмма дисциплины «Современные средства построения интеллектуальных систем»
Программа предназначена для преподавателей, ведущих данную дисциплину, учебных ассистентов и студентов направления подготовки 080700....
Программа дисциплины Анализ данных и прогнозирование для направления 080700. 62 Бизнес-информатика iconПрограмма дисциплины Английский язык для профессиональной деятельности...
Английский язык для профессиональной деятельности для направления 080700. 62 Бизнес-информатика
Программа дисциплины Анализ данных и прогнозирование для направления 080700. 62 Бизнес-информатика iconПрограмма дисциплины «Анализ неструктурированной информации» для...
Программа предназначена для преподавателей, ведущих данную дисциплину, учебных ассистентов и студентов направления 080500. 68 «Бизнес-информатика»...
Программа дисциплины Анализ данных и прогнозирование для направления 080700. 62 Бизнес-информатика iconРабочая программа Учебной дисциплины Программная инженерия Для направления...
Программа составлена в соответствии с Федеральным государственным образовательным стандартом высшего профессионального образования...
Программа дисциплины Анализ данных и прогнозирование для направления 080700. 62 Бизнес-информатика iconПрограмма дисциплины «Экономико-математическое моделирование» для...
Программа предназначена для преподавателей, ведущих данную дисциплину, учебных ассистентов и студентов направления 38. 04. 05 «Бизнес-информатика»...
Программа дисциплины Анализ данных и прогнозирование для направления 080700. 62 Бизнес-информатика iconПрограмма дисциплины «Автоматизация учета на предприятии» для направления...
Программа предназначена для преподавателей, ведущих данную дисциплину, учебных ассистентов и студентов направления подготовки 080500...
Программа дисциплины Анализ данных и прогнозирование для направления 080700. 62 Бизнес-информатика iconПрограмма дисциплины «Основы работы в Microsoft Dynamics Ax» для...
Программа предназначена для преподавателей, ведущих данную дисциплину, учебных ассистентов и студентов направления подготовки 080700....


Школьные материалы


При копировании материала укажите ссылку © 2013
контакты
100-bal.ru
Поиск