Программа дисциплины «Анализ неструктурированной информации» для направления 080500. 68 «Бизнес-информатика»





Скачать 326.52 Kb.
НазваниеПрограмма дисциплины «Анализ неструктурированной информации» для направления 080500. 68 «Бизнес-информатика»
страница4/4
Дата публикации16.10.2014
Размер326.52 Kb.
ТипПрограмма дисциплины
100-bal.ru > Информатика > Программа дисциплины
1   2   3   4

8Образовательные технологии


Образовательные технологии, используемые при реализации различных видов учебной работы: доклады, обсуждения, решение задач, рассмотрение кейсов.

9Оценочные средства для текущего контроля студентов

9.1Содержание заданий текущего контроля


Аудиторная контрольная работа проводится по решению конкретной задачи с применением методов анализа неструктурированной информации.

Выполнение домашних заданий предусматривает построение моделей анализа неструктурированной информации, выявление регулярных выражений, построение аналитических срезов и фильтров, выделение корреляций между срезами, отображение взаимосвязей и визуализацию итогов анализа в системе IBM Content Analytics.

Написание рефератов осуществляется на основе зарубежных (англоязычных) публикаций по вопросам теории и практики систем анализа неструктурированной информации, а также на основе результатов выполнения домашних заданий.

9.2Тематика рефератов


  1. Сравнительный анализ аппаратных решений для «Больших данных».

  2. Методы машинного обучения и искусственный интеллект.

  3. Персептрон и кибернетическая модель мозга.

  4. Искусственные системы распознавания образов.

  5. Сравнительный анализ распределенных файловых систем.

  6. Сравнительный анализ key-value хранилищ.

  7. Сравнительный анализ поколоночных и key-value хранилищ.

  8. Машинная обработка естественных языков.

  9. Переосмысление глобальных данных: рост объемов и ценности информации (Mapping global data: growth and value creation).

  10. Преобразование потенциала больших данных в сфере здравоохранения (The transformative potential of big data in health care domain).

  11. Преобразование потенциала больших данных в сфере государственного управления (The transformative potential of big data in public sector administration domain).

  12. Преобразование потенциала больших данных в сфере торговли (The transformative potential of big data in retail domain).

  13. Преобразование потенциала больших данных в сфере промышленности (The transformative potential of big data in manufacturing domain).

  14. Преобразование потенциала больших данных в сфере навигации (The transformative potential of big data in personal location data domain).

  15. Влияние «Больших данных» на руководителей организаций (Implications for organization leaders).

  16. Влияние «Больших данных» на политику (Implications for policy makers).

  17. Построение индексов потенциальной ценности и простоты преобразования информации (Construction of indices on value potential and ease of capture).

  18. Методология преобразования информации (Data map methodology).

  19. Методология анализа спроса и предложения на специалистов в области бизнес-аналитики (Methodology for analyzing the supply and demand of analytical talent).

  20. Hadoop-Hive: SQL-подобное манипулирование данными.

  21. Система ввода-вывода в Hadoop (Hadoop I/O).

  22. Типы и форматы MapReduce (MapReduce types and formats).

  23. Настройка кластера Hadoop (Setting up a Hadoop cluster).

  24. Администрирование Hadoop (Administering Hadoop).

  25. Pig: платформа создания MapReduce приложений.

  26. Нереляционная распределённая база данных HBase.

  27. ZooKeeper: централизованная служба поддержки конфигурации.

  28. Sqoop: простая миграция из реляционных баз данных.

  29. Установка Apache Hadoop (Installing Apache Hadoop).

  30. Oozie: планировщик рабочего процесса системы управления рабочими местами.

  31. Flume: система для эффективного сбора, объединения и перемещения больших объемов данных, полученных из различных источников, в централизованное хранилище данных.

  32. Hue: пользовательский интерфейс Hadoop.

  33. Avro: удаленный вызов процедур и сериализация.

  34. Таксономия, исследование и другие вопросы экосистемы облачных вычислений (A taxonomy, survey, and issues of cloud computing ecosystems).

  35. Изучение облачных вычислений с точки зрения сетевого анализа и совместной работы (Examining cloud computing from the perspective of grid and computer-supported sooperative work).

  36. Анализ облачных стандартов (Overview of cloud standards).

  37. P2P фреймворк для поддержки приложений MapReduce в динамических облаках (A peer-to-peer framework for supporting MapReduce applications in dynamic cloud environments).

  38. Улучшенная поддержка сети для масштабируемых облачных вычислений (Enhanced network support for scalable computing clouds).

  39. YML-PC: эталонная архитектура на основе workflow для создания частных наукоемких облаков (YML-PC: a reference architecture based on workflow for building scientific private clouds).

  40. Управление ресурсами для гибридных сетей и облачных вычислений (Resource management for hybrid grid and cloud computing).

  41. P2P расшаривание облака: эффективный поиск и распределение нагрузки (Peer-to-Peer cloud provisioning: service discovery and load-balancing).

  42. Облачные вычисления – конфиденциальность данных и проблемы совместимости (Cloud computing – data confidentiality and interoperability challenges).

  43. Технологии для исполнения и распространения правил и политик в облачной архитектуре (Technologies for enforcement and distribution of policy in cloud architectures).

9.3Вопросы для оценки качества освоения дисциплины

Вопросы к Разделу 1. КОНЦЕПЦИЯ «БОЛЬШИХ ДАННЫХ»

  1. В чем принципиальное отличие концепции Big Data от традиционного подхода BI?

  2. Понятие явной (выраженной) и скрытой (структурной) информации.

  3. Определение контент-анализа.

  4. Каковы основные понятия контент-анализа?

  5. Какие существуют виды контент-анализа?

  6. Какие существуют этапы контент-анализа?

  7. Каковы основные признаки, характеризующие «Большие данные»?
Вопросы к Разделу 2. НЕСТРУКТУРИРОВАННАЯ ИНФОРМАЦИЯ

  1. Концепция Enterprise Content Management (ЕСМ).

  2. Сущность и задачи кластеризации.

  3. Основные понятия, принципы и предпосылки генетических алгоритмов.

  4. Достоинства и недостатки генетических алгоритмов.

  5. Классификация нейронных сетей и принципы построения.

  6. Искусственная нейронная сеть прямого прохода.

  7. Использование генетических алгоритмов для обучения искусственных нейронных сетей

  8. Кластеризация как инструмент предварительной обработки данных для искусственной нейронной сети

  9. Какова цель синтаксического анализа?

  10. Общая схема алгоритма синтаксического анализа «сверху-вниз» и «снизу-вверх».


Вопросы к Разделу 3. АППАРАТНОЕ И ПРОГРАММНОЕ ОБЕСПЕЧЕНИЕ «БОЛЬШИХ ДАННЫХ»

  1. Схема работы фаз map(ƒ, c) и reduce(ƒ, c).

  2. Преимущества, ограничения и недостатки парадигмы MapReduce.

  3. Какие бывают модели данных и запросов в NoSQL?

  4. Какие бывают системы хранения данных в NoSQL?

  5. Основные принципы работы фреймворка Hadoop.

  6. Репликация данных в распределенной файловой системе HDFS.
Вопросы к Разделу 4. МАСШТАБИРОВАНИЕ И МНОГОУРОВНЕВОЕ ХРАНЕНИЕ «БОЛЬШИХ ДАННЫХ»

  1. Модели развертывания облачных хранилищ.

  2. Модели обслуживания облачных хранилищ.

  3. Постановка и описание проблемы «последней мили».

  4. Безопасность, производительность и надежность при работе с облачными данными.

  5. Экономическая составляющая облачных подходов.

  6. Способы машинного обучения.

  7. Основные фазы обработки «больших данных».
Вопросы к Разделу 5. ПРАКТИЧЕСКОЕ ПРИМЕНЕНИЕ «БОЛЬШИХ ДАННЫХ»

  1. Чем отличаются текстовая и персональная базы данных?

  2. Метод анализа комбинации слов (collocate analysis).

  3. Понятие "сила связи".

  4. Статистическая мера совместной встречаемости слов и категорий (Z-score).

  5. Реализация закономерностей в системе IBM Content Analytics.


10Порядок формирования итоговой оценки по дисциплине


Формирование оценок по учебной дисциплине производится в соответствии с Положением об организации контроля знаний, утвержденного Ученым советом НИУ ВШЭ от 24.06.2011, протокол №26.

В соответствии с Рабочим учебным планом, формами текущего контроля являются контрольная работа, реферат и домашнее задание. Каждая из форм текущего контроля оценивается по 10-балльной шкале. Общая оценка за текущий контроль (по 10-балльной шкале) рассчитывается по формуле:

Отекущий = 0,2 · Ок/р + 0,5 · Ореф + 0,3 · Одз ,

где Ок/р – оценка за контрольную работу;

Ореф – оценка за реферат;

Одз – оценка за домашнее задание.

При определении накопленной оценки (по 10-балльной шкале) аудиторная работа и самостоятельная внеаудиторная работа не оцениваются. Поэтому накопленная оценка совпадает с оценкой за текущий контроль и рассчитывается по формуле:

Онакопленная = 1,0 · Отекущий + 0,0 · Оауд + 0,0 · Осам.работа ,

где Отекущий – оценка за текущий контроль;

Оауд – оценка за аудиторную работу;

Осам.работа – оценка за самостоятельную работу.

Результирующая оценка (выставляется в диплом) формируется на основе итоговой оценки за экзамен (по 10-балльной шкале) и накопленной оценки. Результирующая оценка рассчитывается по формуле:

Орезульт = 0,3 · Оэкз + 0,7 · Онакопленная ,

где Оэкз – оценка за итоговый контроль (экзамен);

Онакопленная – накопленная оценка.

При формировании оценок на основе весовых коэффициентов применяется округление до целого числа в большую сторону.

11Учебно-методическое и информационное обеспечение дисциплины

11.1Базовый учебник


Барсегян А.А. Анализ данных и процессов. – БХВ-Петербург, 2009. – с. 512.

11.2Основная литература


Аверьянов Л.Я. Контент-анализ. – М. КноРус, 2009. – с. 451.

Тюрин Ю.Н. Анализ данных на компьютере. – М. ИНФРА-М, 2003. – с. 544.

Фомичева И.Д. Социология СМИ. Учебное пособие. Рекомендовано УМО по классическому университетскому образованию РФ в качестве учебного пособия для студентов высших учебных заведений. – М. Аспект Пресс, 2012. – с. 360.

Шалак В.И. Современный контент-анализ. – ОМЕГА-Л, 2009. – с. 272.

Krippendorff K. Content analysis. – Los Angeles SAGE Publications, 2013. – 456 p.

Zikopoulos P.C., Eaton C., De Roos D., Deutsch T., Lapis G. Understanding Big Data. Analytics for Enterprise Class Hadoop and Streaming Data. – McGraw-Hill, 2012.

11.3Дополнительная литература


Гладков Л.А., Курейчик В.В., Курейчик В.М. Генетические алгоритмы: Учебное пособие. – 2-е изд. – М: Физматлит, 2006. – с. 320.

Гребнев Е. Облачные сервисы. Взгляд из России. – М.: CNews, 2011.

Емельянов В.В., Курейчик В.В., Курейчик В.М. Теория и практика эволюционного моделирования. – М: Физматлит, 2003. – с. 432.

Лэм Ч. Hadoop в действии. – М.: ДМК Пресс, 2012.

Методологические и методические проблемы контент-анализа. Вып. 1-2. – М. – Л., 1973.

Фаулер М., Прамодкумар Дж. Садаладж. NoSQL: новая методология разработки нереляционных баз данных. – М.: «Вильямс», 2013. – с. 192.

Шалак В.И. Современный контент-анализ: Приложения в области: политологии, психологии, социологии, культурологии, экономики, рекламы. – М., 2004.

Dean J., Ghemawat S. MapReduce: Simplified data processing on large clusters. In Proceedings of the Sixth Conference on Operating System Design and Implementation – Berkeley, CA, 2004.

Gillam L. Cloud Computing: Principles, Systems and Applications – L.:Springer,2010. – 379 p.

Weber R. Basic Content Analysis. Newbury Park. Calif., 1990.

White T. Hadoop: The Definitive Guide. – 2-nd edition. – Sebastopol: O’Reilly Media, 2011. – 600 p.

11.4Справочники, словари, энциклопедии


Тезаурус социологии. Книга 2. Методология и методы социологических исследований. Тематический словарь-справочник. Под редакцией: Тощенко Ж.Т. – М.: Юнити-Дана, 2013. – с. 416.

Big Data: The Next Frontier for Innovation, Competition, and Productivity. – McKinsey Global Institute, May 2011.

Big Data: What It Is and Why You Should Care. White Paper. – IDC, 2011.

11.5Программные средства


Для подготовки практических задач, докладов и выступлений студентами используется современная учебно-лабораторная база, в том числе:

  • стандартные пакеты прикладных программ офисного назначения, в том числе:

    • информационные системы подготовки текстов (Microsoft Word);

    • системы электронных таблиц (Microsoft Excel);

    • системы подготовки презентаций (Microsoft PowerPoint);

  • профессиональные информационные системы, в том числе:

    • IBM Cognos BI;

    • IBM Content Analytics;

    • Microsoft SQL Server.



11.6Дистанционная поддержка дисциплины


Не предусмотрена.

12Материально-техническое обеспечение дисциплины


Используются персональный компьютер (ноутбук) и проектор для проведения лекций и практических занятий, техническое оснащение компьютерных классов.

Авторы программы: /_____________________ / А.Л.Бекларян
1   2   3   4

Похожие:

Программа дисциплины «Анализ неструктурированной информации» для направления 080500. 68 «Бизнес-информатика» iconПрограмма дисциплины «Анализ неструктурированной информации» для...
Программа предназначена для преподавателей, ведущих данную дисциплину, учебных ассистентов и студентов направления 38. 04. 05 «Бизнес-информатика»...
Программа дисциплины «Анализ неструктурированной информации» для направления 080500. 68 «Бизнес-информатика» iconПрограмма дисциплины «Системы имитационного моделирования» для направления...
Программа предназначена для преподавателей, ведущих данную дисциплину, учебных ассистентов и студентов направления 080500. 68 «Бизнес-информатика»...
Программа дисциплины «Анализ неструктурированной информации» для направления 080500. 68 «Бизнес-информатика» iconПрограмма дисциплины «Методология и практика ит-консалтинга» для...
Программа предназначена для преподавателей, ведущих данную дисциплину, учебных ассистентов и студентов направления 080500. 68 «Бизнес-информатика»...
Программа дисциплины «Анализ неструктурированной информации» для направления 080500. 68 «Бизнес-информатика» iconПрограмма дисциплины «Методология и практика ит-консалтинга» для...
Программа предназначена для преподавателей, ведущих данную дисциплину, учебных ассистентов и студентов направления 080500. 68 «Бизнес-информатика»...
Программа дисциплины «Анализ неструктурированной информации» для направления 080500. 68 «Бизнес-информатика» iconПрограмма дисциплины «Информационные системы целевого управления»...
Программа предназначена для преподавателей, ведущих данную дисциплину, учебных ассистентов и студентов направления 080500. 68 «Бизнес-информатика»...
Программа дисциплины «Анализ неструктурированной информации» для направления 080500. 68 «Бизнес-информатика» iconПрограмма дисциплины Системный анализ и проектирование для направления...
Программа предназначена для преподавателей, ведущих данную дисциплину, учебных ассистентов и студентов, обучающихся по магистерской...
Программа дисциплины «Анализ неструктурированной информации» для направления 080500. 68 «Бизнес-информатика» iconПрограмма дисциплины «Современный финансовый менеджмент»  для направления...
Программа предназначена для преподавателей, ведущих данную дисциплину, учебных ассистентов и студентов направления 080500. 68 «Бизнес-информатика»...
Программа дисциплины «Анализ неструктурированной информации» для направления 080500. 68 «Бизнес-информатика» iconПрограмма дисциплины Мобильные приложения Для направления специальности...
Программа предназначена для преподавателей, ведущих данную дисциплину, учебных ассистентов и студентов направления 080500. 68 «Бизнес-информатика»...
Программа дисциплины «Анализ неструктурированной информации» для направления 080500. 68 «Бизнес-информатика» iconПрограмма дисциплины Мобильные приложения Для направления специальности...
Программа предназначена для преподавателей, ведущих данную дисциплину, учебных ассистентов и студентов направления 080500. 68 «Бизнес-информатика»...
Программа дисциплины «Анализ неструктурированной информации» для направления 080500. 68 «Бизнес-информатика» iconПрограмма дисциплины Информационные технологии управления знаниями...
Программа предназначена для преподавателей, ведущих данную дисциплину, учебных ассистентов и студентов направления 080500. 68 «бизнес-информатика»...
Программа дисциплины «Анализ неструктурированной информации» для направления 080500. 68 «Бизнес-информатика» iconПрограмма дисциплины «Архитектура предприятия» для направления 080500. 62 «Бизнес-информатика»
Программа предназначена для преподавателей, ведущих данную дисциплину, учебных ассистентов и студентов направления 080500. 62 «Бизнес-информатика»...
Программа дисциплины «Анализ неструктурированной информации» для направления 080500. 68 «Бизнес-информатика» iconПрограмма дисциплины “ Информационные процессы, системы и сети” для...
Программа предназначена для преподавателей, ведущих данную дисциплину, учебных ассистентов и студентов направления 080500. 62 Бизнес-информатика,...
Программа дисциплины «Анализ неструктурированной информации» для направления 080500. 68 «Бизнес-информатика» iconРабочая программа Учебной дисциплины Научно-исследовательский семинар...
Программа составлена в соответствии с Федеральным государственным образовательным стандартом высшего профессионального образования...
Программа дисциплины «Анализ неструктурированной информации» для направления 080500. 68 «Бизнес-информатика» iconПрограмма дисциплины “Философия и логика науки“ для направления 080500....
Программа предназначена для преподавателей, ведущих данную дисциплину, учебных ассистентов и студентов направления 080500. 62 «Бизнес-информатика»....
Программа дисциплины «Анализ неструктурированной информации» для направления 080500. 68 «Бизнес-информатика» iconПрограмма дисциплины «Теория организации» для направления 080500. 62 «Бизнес-информатика»
Программа предназначена для преподавателей, ведущих данную дисциплину, учебных ассистентов и студентов направления подготовки 080500....
Программа дисциплины «Анализ неструктурированной информации» для направления 080500. 68 «Бизнес-информатика» iconПрограмма дисциплины «Философия»  для направления 080500. 62 «Бизнес-информатика»
Программа предназначена для преподавателей, ведущих данную дисциплину, учебных ассистентов и студентов направления подготовки 080500....


Школьные материалы


При копировании материала укажите ссылку © 2013
контакты
100-bal.ru
Поиск