Программа дисциплины «Анализ неструктурированной информации» для направления 080500. 68 «Бизнес-информатика»





Скачать 326.52 Kb.
НазваниеПрограмма дисциплины «Анализ неструктурированной информации» для направления 080500. 68 «Бизнес-информатика»
страница3/4
Дата публикации16.10.2014
Размер326.52 Kb.
ТипПрограмма дисциплины
100-bal.ru > Информатика > Программа дисциплины
1   2   3   4

6Формы контроля знаний студентов




Тип

контроля

Форма контроля

1 год

Параметры

2

3

Текущий

(неделя)

Контрольная

работа




9

Письменная работа 90 минут, оценка результатов – 1 неделя

Реферат




8

Объем 20-25 стр., оценка результатов – 2 недели

Домашнее

задание




9

Пояснительная записка до 20 стр., оценка результатов – 2 недели

Итоговый

(неделя)

Экзамен




10

  1. Устный экзамен

  2. Письменный экзамен на базе материалов IBM.


6.1Критерии оценки знаний, навыков


Студент должен продемонстрировать знание разделов дисциплины и способность представить результаты выполнения домашних заданий и качественный реферат на заданную тему в соответствии с требуемыми компетенциями.

Оценки по всем формам текущего контроля выставляются по 10-ти балльной шкале.

7Содержание дисциплины

Раздел 1. КОНЦЕПЦИЯ «БОЛЬШИХ ДАННЫХ»
Тема 1.1. Возникновение феномена «Больших данных»

Что такое «Большие данные», и что они нам сулят. Разница между бизнес-аналитикой и «Большими данными». Устаревание информации. Рост объемов данных на фоне вытеснения аналоговых средств хранения. Корректная интерпретация информационных потоков. Обработка информационных потоков. Предпосылки применения контент-анализа в различных исследованиях.

Основная литература

Барсегян А.А. Анализ данных и процессов. – БХВ-Петербург, 2009. – с. 512.

Дополнительная литература

Тюрин Ю.Н. Анализ данных на компьютере. – М. ИНФРА-М, 2003. – с. 544.

Zikopoulos P.C., Eaton C., De Roos D., Deutsch T., Lapis G. Understanding Big Data. Analytics for Enterprise Class Hadoop and Streaming Data. – McGraw-Hill, 2012.
Тема 1.2. Преобразование текста в аналитический ресурс

Необходимость в аналитической работе с большими данными. Явная (выраженная) и скрытая (структурная) информация. Количественная и качественная стратегия анализа текстов. Возможности и ограничения каждого из подходов. Процедура контент-анализа. Определение круга проблем для контент-анализа. Начальный этап исследования: формулирование целей и задач исследования, выбор эмпирического материала, выдвижение рабочих гипотез. Операциональный этап исследования: определение категорий и подкатегорий, выбор единиц анализа, установление правил кодирования. Этап счета. Этап интерпретации результатов. Презентация результатов. Типичные ошибки при проведении контент-анализа.

Основная литература

Барсегян А.А. Анализ данных и процессов. – БХВ-Петербург, 2009. – с. 512.

Krippendorff K. Content analysis. – Los Angeles SAGE Publications, 2013. – 440 p.

Дополнительная литература

Тюрин Ю.Н. Анализ данных на компьютере. – М. ИНФРА-М, 2003. – с. 544.

Шалак В.И. Современный контент-анализ. – ОМЕГА-Л, 2009. – с. 272.

Weber R. Basic Content Analysis. Newbury Park. Calif., 1990.
Тема 1.3. Технический аспект «Больших данных»

Технические признаки, характеризующие «Большие данные». Принцип V3 – Volume (объём данных), Variety (разнообразие данных) и Velocity (скорость генерации и работы с данными). Интеграция, миграция и построение хранилищ данных. Высокопроизводительные вычисления (High Performance Computing, HPC) при выполнении аналитических исследований. Grid computing (распределенные вычисления на нескольких серверах), in-database analytics (частичный перевод нагрузки при аналитических вычислениях в СУБД, а также регламентное применение готовых аналитических моделей к новым данным полностью на стороне СУБД) и in-memory analytics (применение аналитики прямо в оперативной памяти сервера СУБД).

Основная литература

Барсегян А.А. Анализ данных и процессов. – БХВ-Петербург, 2009. – с. 512.

Дополнительная литература

Методологические и методические проблемы контент-анализа. Вып. 1-2. – М. – Л., 1973.

Big Data: The Next Frontier for Innovation, Competition, and Productivity. – McKinsey Global Institute, May 2011.

Big Data: What It Is and Why You Should Care. White Paper. – IDC, 2011.

Zikopoulos P.C., Eaton C., De Roos D., Deutsch T., Lapis G. Understanding Big Data. Analytics for Enterprise Class Hadoop and Streaming Data. – McGraw-Hill, 2012.
Раздел 2. НЕСТРУКТУРИРОВАННАЯ ИНФОРМАЦИЯ
Тема 2.1. Концепция Enterprise Content Management (ЕСМ)

Управление корпоративными ресурсами, сопровождение информации, управление документами (создание, контроль, безопасность, возврат и перемещение документа, группировка); управление бумажными документами (в том числе их оцифровка путем сканирования); возможность осуществления групповой работы над документами и объединение их в проекты; организация архивного хранения документов (при этом соблюдаются как законодательные нормы, так и внутренние нормы предприятия). Организация документов, поддерживающих бизнес-процессы предприятия, в том числе, осуществление маршрутизации заданий с дальнейшей проверкой исполнения; управление веб-контентом, который применяется для публикации, а также контентом, который является вспомогательным для работников предприятия.

Основная литература

Барсегян А.А. Анализ данных и процессов. – БХВ-Петербург, 2009. – с. 512.

Дополнительная литература

Аверьянов Л.Я. Контент-анализ. – М. КноРус, 2009. – с. 451.

Тюрин Ю.Н. Анализ данных на компьютере. – М. ИНФРА-М, 2003. – с. 544.

Шалак В.И. Современный контент-анализ. – ОМЕГА-Л, 2009. – с. 272.

Тезаурус социологии. Книга 2. Методология и методы социологических исследований. Тематический словарь-справочник. Под редакцией: Тощенко Ж.Т. – М.: Юнити-Дана, 2013. – с. 416.

Mancini J. Enterprise Content Management: Critical Technologies for Business Applications // AIIM, 2001.
Тема 2.2. Методы анализа неструктурированной информации

Эвристические алгоритмы поиска, эволюционное вычисление, этапы генетического алгоритма: задание целевой функции (приспособленности) для особей популяции, создание начальной популяции, размножение (скрещивание), мутирование, вычисление значения целевой функции для всех особей, формирование нового поколения (селекция).

Задача кластеризации, методы кластеризации, иерархическая кластеризация, алгоритм k-средних, зонтичная кластеризация, методы ненаправляемого обучения (Unsupervised Learning). Постановка задачи классификации, подходы и применения, построение и обучение классификатора, оценка качества классификации, рубрикации тренировочных данных (Training Data Set), методы управляемого (направляемого) обучения (Supervised Learning).

Методы распознавания образов, дискриминантный анализ, нелинейная оптимизация, этапы формирования нейронных сетей: сбор данных для обучения, подготовка и нормализация данных, выбор топологии сети, экспериментальный подбор характеристик сети, экспериментальный подбор параметров обучения, собственно обучение, проверка адекватности обучения, корректировка параметров, окончательное обучение, вербализация сети с целью дальнейшего использования.

Основная литература

Барсегян А.А. Анализ данных и процессов. – БХВ-Петербург, 2009. – с. 512.

Дополнительная литература

Гладков Л.А., Курейчик В.В., Курейчик В.М. Генетические алгоритмы: Учебное пособие. – 2-е изд. – М: Физматлит, 2006. – с. 320.

Емельянов В.В., Курейчик В.В., Курейчик В.М. Теория и практика эволюционного моделирования. – М: Физматлит, 2003. – с. 432.

Фомичева И.Д. Социология СМИ. Учебное пособие. Рекомендовано УМО по классическому университетскому образованию РФ в качестве учебного пособия для студентов высших учебных заведений. – М. Аспект Пресс, 2012. – с. 360.


Тема 2.3. Обработка естественных языков и анализ настроений

Совместное использование компьютерных технологий и лингвистики для создания алгоритмов, позволяющих анализировать естественные (человеческие) языки. Применение методов обработки естественных языков и других аналитических методов для выявления и извлечения из анализируемого текста субъективной информации, характеризующей настроения, мнения, отношение людей к проблеме. Рассмотрение следующих основных задач: синтез речи, распознавание речи, анализ текста, синтез текста, машинный перевод, вопросно-ответные системы, информационный поиск, извлечение информации, анализ тональности текста, анализ высказываний, упрощение текста.

Основная литература

Барсегян А.А. Анализ данных и процессов. – БХВ-Петербург, 2009. – с. 512.

Krippendorff K. Content analysis. – Los Angeles SAGE Publications, 2013. – 440 p.

Дополнительная литература

Фомичева И.Д. Социология СМИ. Учебное пособие. Рекомендовано УМО по классическому университетскому образованию РФ в качестве учебного пособия для студентов высших учебных заведений. – М. Аспект Пресс, 2012. – с. 360.

Шалак В.И. Современный контент-анализ: Приложения в области: политологии, психологии, социологии, культурологии, экономики, рекламы. – М., 2004.

Методологические и методические проблемы контент-анализа. Вып. 1-2. – М. – Л., 1973.
Раздел 3. АППАРАТНОЕ И ПРОГРАММНОЕ ОБЕСПЕЧЕНИЕ «БОЛЬШИХ ДАННЫХ»
Тема 3.1. Вычислительная парадигма MapReduce и концепция NoSQL

Вычисления некоторых наборов распределенных задач с использованием большого количества компьютеров, образующих кластер. Шаги Map и Reduce. Предварительная обработка входных данных и свёртка данных. Концепция параллелизма. Шаблоны доступа к данным, хеш-таблица, деревья, таксономия NoSQL, колоночные СУБД, bigtable.

Основная литература

Барсегян А.А. Анализ данных и процессов. – БХВ-Петербург, 2009. – с. 512.

Дополнительная литература

Фаулер М., Прамодкумар Дж. Садаладж. NoSQL: новая методология разработки нереляционных баз данных. – М.: «Вильямс», 2013. – с. 192.

Dean J., Ghemawat S. MapReduce: Simplified data processing on large clusters. In Proceedings of the Sixth Conference on Operating System Design and Implementation – Berkeley, CA, 2004.
Тема 3.2. Центры хранения данных и управляющее программное обеспечение для массово-параллельной обработки

Разработка и выполнение распределённых программ, расширение вычислительных мощностей посредством добавления в кластер дополнительных узлов, технология Hadoop, распределённая файловая система HDFS (Hadoop Distributed File System), интеграция с NoSQL и MapReduce.

Основная литература

Барсегян, А.А. Анализ данных и процессов. – БХВ-Петербург, 2009. – с. 512.

Дополнительная литература

Лэм Ч. Hadoop в действии. – М.: ДМК Пресс, 2012.

White T. Hadoop: The Definitive Guide. – 2-nd edition. – Sebastopol: O’Reilly Media, 2011. – 600 p.
Раздел 4. МАСШТАБИРОВАНИЕ И МНОГОУРОВНЕВОЕ ХРАНЕНИЕ «БОЛЬШИХ ДАННЫХ»
Тема 4.1. Облачные хранилища и облачные вычисления

Модели развёртывания: частное облако, публичное облако, гибридное облако, общественное облако. Модели обслуживания: программное обеспечение, платформа, инфраструктура. Экономические аспекты центров обработки данных. Безопасность при хранении и пересылке данных. Проблема «последней мили».

Основная литература

Барсегян А.А. Анализ данных и процессов. – БХВ-Петербург, 2009. – с. 512.

Дополнительная литература

Гребнев Е. Облачные сервисы. Взгляд из России. Под ред. – М.: CNews, 2011.

Gillam L. Cloud Computing: Principles, Systems and Applications – L.:Springer,2010. – 379 p.
Тема 4.2. Быстрые Данные (Fast Data), Большая Аналитика (Big Analytics) и Глубокое Проникновение (Deep Insight)

Обработка Fast Data, подтверждение и корректировка априорных знаний и гипотез, синхронизация скорости работы с ростом объема данных. Получение знаний посредством Big Analytics, преобразования зафиксированной в данных информации в новое знание, принцип «обучения с учителем». Высший уровень работы с данными Deep Insight, обучение без учителя (unsupervised learning), использование современных методов аналитики, а также различные способы визуализации, обнаружение знаний и закономерностей, априорно неизвестных.

Основная литература

Барсегян А.А. Анализ данных и процессов. – БХВ-Петербург, 2009. – с. 512.

Дополнительная литература

Zikopoulos P.C., Eaton C., De Roos D., Deutsch T., Lapis G. Understanding Big Data. Analytics for Enterprise Class Hadoop and Streaming Data. – McGraw-Hill, 2012.

Big Data: The Next Frontier for Innovation, Competition, and Productivity. – McKinsey Global Institute, May 2011.

Big Data: What It Is and Why You Should Care. White Paper. – IDC, 2011.

Mancini J. Enterprise Content Management: Critical Technologies for Business Applications // AIIM, 2001.
Раздел 5. ПРАКТИЧЕСКОЕ ПРИМЕНЕНИЕ «БОЛЬШИХ ДАННЫХ»
Тема 5.1. «Большие данные» и анализ интернет контента

Практическое применение решений IBM Content Analytics. Понятие шаблона, создание правил и категорий. Персональная база данных, фразовый поиск, нечеткий поиск. Возможности уточнения результатов запросов с учетом структуры текста. Анализ совместной встречаемости (collocate analysis) и коэффициент связи категорий (Z-score).

Основная литература

Барсегян А.А. Анализ данных и процессов. – БХВ-Петербург, 2009. – с. 512.

Дополнительная литература

Аверьянов Л.Я. Контент-анализ. – М. КноРус, 2009. – с. 451.

Тюрин Ю.Н. Анализ данных на компьютере. – М. ИНФРА-М, 2003. – с. 544.

Шалак В.И. Современный контент-анализ: Приложения в области: политологии, психологии, социологии, культурологии, экономики, рекламы. – М., 2004.

Тема 5.2. «Большие данные» и мониторинг общественного мнения

Практическое применение решений IBM Content Analytics. Контент-анализ массовой корреспонденции и социологических опросов. Прямые пропорциональные закономерности, аддитивные закономерности, мультипликативные закономерности.

Основная литература

Барсегян А.А. Анализ данных и процессов. – БХВ-Петербург, 2009. – с. 512.

Дополнительная литература

Аверьянов Л.Я. Контент-анализ. – М. КноРус, 2009. – с. 451.

Тюрин Ю.Н. Анализ данных на компьютере. – М. ИНФРА-М, 2003. – с. 544.

Фомичева И.Д. Социология СМИ. Учебное пособие. Рекомендовано УМО по классическому университетскому образованию РФ в качестве учебного пособия для студентов высших учебных заведений. – М. Аспект Пресс, 2012. – с. 360.

Шалак В.И. Современный контент-анализ: Приложения в области: политологии, психологии, социологии, культурологии, экономики, рекламы. – М., 2004.
1   2   3   4

Похожие:

Программа дисциплины «Анализ неструктурированной информации» для направления 080500. 68 «Бизнес-информатика» iconПрограмма дисциплины «Анализ неструктурированной информации» для...
Программа предназначена для преподавателей, ведущих данную дисциплину, учебных ассистентов и студентов направления 38. 04. 05 «Бизнес-информатика»...
Программа дисциплины «Анализ неструктурированной информации» для направления 080500. 68 «Бизнес-информатика» iconПрограмма дисциплины «Системы имитационного моделирования» для направления...
Программа предназначена для преподавателей, ведущих данную дисциплину, учебных ассистентов и студентов направления 080500. 68 «Бизнес-информатика»...
Программа дисциплины «Анализ неструктурированной информации» для направления 080500. 68 «Бизнес-информатика» iconПрограмма дисциплины «Методология и практика ит-консалтинга» для...
Программа предназначена для преподавателей, ведущих данную дисциплину, учебных ассистентов и студентов направления 080500. 68 «Бизнес-информатика»...
Программа дисциплины «Анализ неструктурированной информации» для направления 080500. 68 «Бизнес-информатика» iconПрограмма дисциплины «Методология и практика ит-консалтинга» для...
Программа предназначена для преподавателей, ведущих данную дисциплину, учебных ассистентов и студентов направления 080500. 68 «Бизнес-информатика»...
Программа дисциплины «Анализ неструктурированной информации» для направления 080500. 68 «Бизнес-информатика» iconПрограмма дисциплины «Информационные системы целевого управления»...
Программа предназначена для преподавателей, ведущих данную дисциплину, учебных ассистентов и студентов направления 080500. 68 «Бизнес-информатика»...
Программа дисциплины «Анализ неструктурированной информации» для направления 080500. 68 «Бизнес-информатика» iconПрограмма дисциплины Системный анализ и проектирование для направления...
Программа предназначена для преподавателей, ведущих данную дисциплину, учебных ассистентов и студентов, обучающихся по магистерской...
Программа дисциплины «Анализ неструктурированной информации» для направления 080500. 68 «Бизнес-информатика» iconПрограмма дисциплины «Современный финансовый менеджмент»  для направления...
Программа предназначена для преподавателей, ведущих данную дисциплину, учебных ассистентов и студентов направления 080500. 68 «Бизнес-информатика»...
Программа дисциплины «Анализ неструктурированной информации» для направления 080500. 68 «Бизнес-информатика» iconПрограмма дисциплины Мобильные приложения Для направления специальности...
Программа предназначена для преподавателей, ведущих данную дисциплину, учебных ассистентов и студентов направления 080500. 68 «Бизнес-информатика»...
Программа дисциплины «Анализ неструктурированной информации» для направления 080500. 68 «Бизнес-информатика» iconПрограмма дисциплины Мобильные приложения Для направления специальности...
Программа предназначена для преподавателей, ведущих данную дисциплину, учебных ассистентов и студентов направления 080500. 68 «Бизнес-информатика»...
Программа дисциплины «Анализ неструктурированной информации» для направления 080500. 68 «Бизнес-информатика» iconПрограмма дисциплины Информационные технологии управления знаниями...
Программа предназначена для преподавателей, ведущих данную дисциплину, учебных ассистентов и студентов направления 080500. 68 «бизнес-информатика»...
Программа дисциплины «Анализ неструктурированной информации» для направления 080500. 68 «Бизнес-информатика» iconПрограмма дисциплины «Архитектура предприятия» для направления 080500. 62 «Бизнес-информатика»
Программа предназначена для преподавателей, ведущих данную дисциплину, учебных ассистентов и студентов направления 080500. 62 «Бизнес-информатика»...
Программа дисциплины «Анализ неструктурированной информации» для направления 080500. 68 «Бизнес-информатика» iconПрограмма дисциплины “ Информационные процессы, системы и сети” для...
Программа предназначена для преподавателей, ведущих данную дисциплину, учебных ассистентов и студентов направления 080500. 62 Бизнес-информатика,...
Программа дисциплины «Анализ неструктурированной информации» для направления 080500. 68 «Бизнес-информатика» iconРабочая программа Учебной дисциплины Научно-исследовательский семинар...
Программа составлена в соответствии с Федеральным государственным образовательным стандартом высшего профессионального образования...
Программа дисциплины «Анализ неструктурированной информации» для направления 080500. 68 «Бизнес-информатика» iconПрограмма дисциплины “Философия и логика науки“ для направления 080500....
Программа предназначена для преподавателей, ведущих данную дисциплину, учебных ассистентов и студентов направления 080500. 62 «Бизнес-информатика»....
Программа дисциплины «Анализ неструктурированной информации» для направления 080500. 68 «Бизнес-информатика» iconПрограмма дисциплины «Теория организации» для направления 080500. 62 «Бизнес-информатика»
Программа предназначена для преподавателей, ведущих данную дисциплину, учебных ассистентов и студентов направления подготовки 080500....
Программа дисциплины «Анализ неструктурированной информации» для направления 080500. 68 «Бизнес-информатика» iconПрограмма дисциплины «Философия»  для направления 080500. 62 «Бизнес-информатика»
Программа предназначена для преподавателей, ведущих данную дисциплину, учебных ассистентов и студентов направления подготовки 080500....


Школьные материалы


При копировании материала укажите ссылку © 2013
контакты
100-bal.ru
Поиск