Скачать 147.83 Kb.
|
Правительство Российской Федерации федеральное государственное автономное образовательное учреждение высшего профессионального образования "Национальный исследовательский университет "Высшая школа экономики" Факультет бизнес - информатикиПрограмма дисциплиныАнализ данных и прогнозирование для направления 080700.62 – Бизнес-информатика Автор: П.А. Мальцев
Пермь, 2012г.I. Пояснительная записка
Материал учебной дисциплины используется студентами в процессе работы над выпускными работами и магистерскими диссертациями, способствует дальнейшему совершенствованию информационно-коммуникационной компетенции студентов. Задачи: познакомить студентов с методикой анализа данных; познакомит с современными методами анализа данных; дать навыки применения различных методов анализа данных. Курс призван повысить общую эрудицию студентов и расширить их практический опыт разработки ИС.
В результате изучения курса студент должен: Знать:
Уметь:
Иметь представление:
Обладать навыками:
20% результирующей оценки – оценка за работу на семинарских занятиях; 40% результирующей оценки – взвешенная сумма оценок за домашние работы; 40% результирующей оценки – оценка за итоговое устное собеседование. Таким образом, 60% результирующей оценки – это накопительная оценка и 40% – это оценка за итоговый контроль. Результирующая оценка рассчитывается с помощью взвешенной суммы накопительной оценки и оценки за устный зачет. Накопительная оценка рассчитывается с помощью взвешенной суммы оценок за отдельные формы текущего контроля. Формулы расчета оценок: О текущая = n1∙О1 + n2∙О2 + n3∙О3 + ∙∙∙ где Оi – оценки за контрольные мероприятия (эссе, контрольная работа, реферат и пр.) ni – вес контрольных мероприятий (определяются преподавателем и ∑ni=1 или 100%), при этом Веса по контрольным мероприятиям: n1 = 100% - домашняя работа. О накопительная = k1∙Отекущая + k2∙Оаудиторная где ki – вес текущей и аудиторной оценки, при этом k1=2/3, k2=1/3 О результирующая = q1∙Онакопительная + q2∙Оитог.контроль где qi – вес накопительной оценки и оценки за итоговый контроль, при этом q1=0,6, q2=0,4 III. Содержание программы. Раздел 1. Введение в анализ данных Тема 1. Введение. Основные понятия. Пирамида знаний. Постановка задачи анализа данных. История развития технологий анализа данных. Тема 2. Методика анализа данных. Методы сбора и подготовки исходного набора данных. Тема 3. Моделирование неопределённости. Вероятностный подход. Условные Байесовские сети. Раздел 2. Интеллектуальный анализ данных Тема 4. Введение в интеллектуальный анализ данных. Задачи, решаемые методами интеллектуального анализа. Методы Data Mining. Knowledge Discovery in Databases. Тема 5. Постановка задач классификации и регрессии. Основные алгоритмы и методы решения. Тема 6. Постановка задач поиска ассоциативных правил и секвенциального анализа. Основные алгоритмы и методы решения. Тема 7. Постановка задачи кластеризации. Основные алгоритмы и методы решения. Раздел 3. Статистический анализ данных Тема 8. Введение в анализ временных рядов. Определение и классификация временных рядов. Разложение по компонентам. Тема 9. Выделение тренда временного ряда. Тема 10. Тренд-сезонные экономические процессы и их анализ. Тема 11. Корреляционный и дисперсионный анализ. Раздел 4. Визуальный анализ данных Тема 12. Визуальный анализ данных. Применение различных средств визуализации. IV. Учебно-методическое обеспечение дисциплины:
Базовый учебник
Основная
Дополнительная
2. Тематика заданий по различным формам текущего контроля: Приложение 1. Домашнее задание для проведения текущего контроля. Приложение 2. Список вопросов для подготовки к итоговому устному собеседованию. Приложение 3. План семинарских занятий. 3. Методические рекомендации (материалы) преподавателю: На лекциях рекомендуется использовать мультимедийные презентации, иллюстрирующие материал. При этом студенты должны активно участвовать в обсуждении вопросов. Многие из тем курса тесно связны с уже пройденными студентами курсами: «Базы данных», «Имитационное моделирование», «Эконометрика», «Хранилища данных». Рассмотрение подобных тем следует начинать с повторения студентами того, как рассматриваемые вопросы освящались в рамках пройденных курсов. 4. Методические указания студентам: Студентам рекомендуется следующая схема работы над практическим заданием: 1) проработать конспект лекций; 2) проанализировать рекомендованную литературу; 3) проанализировать варианты решений, предложенные преподавателем; 4) при затруднениях сформулировать вопросы к преподавателю.
Все практические занятия проводятся в компьютерном классе. Для выполнения практических заданий студенты должны иметь доступ к следующему программному обеспечению: MS Excel 2010 MS Visual Studio 2010 MS Development Network MS SQL Server 2008 Автор программы __________________________Мальцев П.А. V. Тематический расчет часов
Автор программы __________________________ Мальцев П.А. Приложение 1 Домашнее задание для проведения текущего контроля Домашнее задание 1 «Программная реализация решения одной из задач интеллектуального анализа данных» Студентам предлагается разработать программу решающую одну из задач интеллектуального анализа данных:
Студенты самостоятельно выбирает источники данных для разрабатываемой программы. Если преподаватель считает выбранные источники достаточными для успешного выполнения задания, то студент может приступать к выполнению задания. В противном случае студент должна устранить все замечания преподавателя и повторно представит тему на согласование. После согласования темы, студентом разрабатывается программа. Критерии оценки Оценка программы выполняется в соответствии со следующими критериями:
Приложение 2 Список вопросов для подготовки к итоговому устному собеседованию
Приложение 3 План семинарских занятий Тема 1. Методика анализа данных (4 часа). Сбор эмпирических данных, очистка нормализация и трансформация данных, идентификация и поиск моделей. Литература по теме:
Тема 2. Моделирование неопределённостей (2 часа). Основные модели моделирования неопределённостей, вероятностный подход, условные Байесовские сети. Литература по теме:
Тема 3. Задачи решаемые методами Data Mining (6 часа). Программная реализация алгоритмов: построения 1r-првил, Naive Bayes, ID3, C4.5, Apriori, k-means, Fuzzy C-Means. Литература по теме:
Тема 4. Статистический анализ данных (12 часов). Выделение тренда Анализ тренд-сезонных временных процессов. Корреляционный и дисперсионный анализ. Литература по теме:
|
Рабочая программа Учебной дисциплины Анализ данных Для направления... Программа составлена в соответствии с Федеральным государственным образовательным стандартом высшего профессионального образования... | Рабочая программа Учебной дисциплины Базы данных Для направления... Программа составлена в соответствии с Федеральным государственным образовательным стандартом высшего профессионального образования... | ||
Рабочая программа Учебной дисциплины Хранилища данных Для направления... Программа составлена в соответствии с Федеральным государственным образовательным стандартом высшего профессионального образования... | Программа дисциплины «Базы данных» для направления 080700. 62 Бизнес-информатика... «Базы данных» для направления 080700. 62 Бизнес-информатика подготовки бакалавра | ||
Рабочая программа Учебной дисциплины Объектно-ориентированный анализ... Программа составлена в соответствии с Федеральным государственным образовательным стандартом высшего профессионального образования... | Рабочая программа Учебной дисциплины Операционные системы Для направления... Программа составлена в соответствии с Федеральным государственным образовательным стандартом высшего профессионального образования... | ||
Программа дисциплины «Архитектура корпоративных информационных систем»... «Архитектура корпоративных информационных систем» для направления 080700. 68 «Бизнес-информатика» подготовки бакалавра | Программа дисциплины «Проектирование информационных систем» для направления... «Проектирование информационных систем» для направления 080700. 68 «Бизнес-информатика» подготовки бакалавра | ||
Программа дисциплины «Анализ неструктурированной информации» для... Программа предназначена для преподавателей, ведущих данную дисциплину, учебных ассистентов и студентов направления 38. 04. 05 «Бизнес-информатика»... | Программа дисциплины «Современные средства построения интеллектуальных систем» Программа предназначена для преподавателей, ведущих данную дисциплину, учебных ассистентов и студентов направления подготовки 080700.... | ||
Программа дисциплины Английский язык для профессиональной деятельности... Английский язык для профессиональной деятельности для направления 080700. 62 Бизнес-информатика | Программа дисциплины «Анализ неструктурированной информации» для... Программа предназначена для преподавателей, ведущих данную дисциплину, учебных ассистентов и студентов направления 080500. 68 «Бизнес-информатика»... | ||
Рабочая программа Учебной дисциплины Программная инженерия Для направления... Программа составлена в соответствии с Федеральным государственным образовательным стандартом высшего профессионального образования... | Программа дисциплины «Экономико-математическое моделирование» для... Программа предназначена для преподавателей, ведущих данную дисциплину, учебных ассистентов и студентов направления 38. 04. 05 «Бизнес-информатика»... | ||
Программа дисциплины «Автоматизация учета на предприятии» для направления... Программа предназначена для преподавателей, ведущих данную дисциплину, учебных ассистентов и студентов направления подготовки 080500... | Программа дисциплины «Основы работы в Microsoft Dynamics Ax» для... Программа предназначена для преподавателей, ведущих данную дисциплину, учебных ассистентов и студентов направления подготовки 080700.... |