Анализ данных науки, образования и инновационной деятельности с использованием методов анализа паттернов





НазваниеАнализ данных науки, образования и инновационной деятельности с использованием методов анализа паттернов
Дата публикации21.04.2015
Размер72.8 Kb.
ТипАнализ
100-bal.ru > География > Анализ

Анализ данных науки, образования и инновационной деятельности

с использованием методов анализа паттернов


Алескеров Ф.Т., Гохберг Л.М., Егорова Л.Г., Мячин А., Сагиева Г.С.

Национальный исследовательский университет «Высшая школа экономики»

1. Введение

Проблема анализа данных науки, образования и инновационной деятельности является сложной и комплексной задачей, и проводить исследования, связанные с этими сферами человеческой деятельности, можно различными способами, с использованием разных методик и разных методических подходов. В данной статье будет описан метод анализа паттернов и результаты его применения к поставленной проблеме анализа развития науки, образования и успешности инновационной деятельности в регионах Российской Федерации.

Анализ паттернов – это новая область анализа данных, связанная с поиском взаимосвязей исследуемых объектов, построение их классификации и исследованием развития объектов во времени. Задачей анализа паттернов является разбиение заданной выборки объектов на подмножества, называемые паттернами, так, чтобы каждый паттерн состоял из схожих объектов, а объекты разных паттернов существенно отличались. То есть любой паттерн отражает такие существенные характеристики класса объектов, которые выделяют объекты этого паттерна среди всей остальной совокупности. Отличием методов анализа паттернов является работа с совокупностью всех признаков и умение соотносить в один паттерн объекты, имеющие разные количественные характеристики, но одинаковую внутреннюю структуру показателей и взаимосвязей между ними.

Есть два подхода к анализу паттернов данных – первый рассматривает паттерны в «статическом виде», анализируя разбиение объектов выборки по классам/типам/кластерам, второй подход обобщает и развивает эту идею, проводя анализ паттернов, выбираемых объектами, с течением времени.

Ранее оба метода применялись для конкретных прикладных задач, например, для исследования банков по выбранной бизнес-модели [6, 9], стран по характеру зависимости макроэкономических показателей [1, 2], характера конкуренции между политическими партиями по избирательным округам [7] или для поддержки решения менеджера о распределении персонала по филиалам [3, 4, 5].

Данные методы были использованы для анализа данных науки, образования и инновационной деятельности в Российской Федерации. Объектами анализа являются регионы РФ, целью – построение системы индикаторов, адекватно отражающих положение региона в части развития в нем науки, инновационной деятельности и образования.

Данная работа является частью более общей задачи по анализу данных науки, образования и инноваций, которая выполняется НИУ ВШЭ по заказу Министерства образования и науки РФ в рамках государственного контракта No. 07.514.11.4144 «Разработка экспериментального образца программного обеспечения анализа
статистических данных науки, образования и инновационной деятельности
с использованием перспективных методов: анализа паттернов данных и
онтологического моделирования», шифр «2012-1.4-07-514-0041».

2. Анализ паттернов

Методы анализа паттернов состоят из трех этапов: предварительные этапы связаны с поиском информации, первичной статистической обработкой найденных данных и выбором базовой системы показателей, основной этап статического метода анализа паттернов связан с переходом в признаковое пространство объектов и проведение кластеризации для поиска паттернов, затем при необходимости исследования поведения объектов в динамике может быть проведен динамический анализ паттернов.

Общая схема работы методов анализа паттернов представлена на Рис.1.

3. Выбор базовой системы независимых показателей

1. Сбор данных, проверка качества найденных данных

2. Корреляционный анализ исходных показателей

4. Кластеризация объектов,

представленных в виде кусочно-линейной функции

5. Интерпретация полученных паттернов

6. Динамический анализ паттернов

1 этап. Выбор системы показателей

2 этап.

Анализ паттернов

3 этап.


Рис. . Схема применения методов анализа паттернов


На первом этапе создана базовая система показателей на основе системы, разработанной для построения рейтинга инновационного развития регионов коллективом ИСИЭЗ НИУ ВШЭ [11]. Для решения поставленной задачи указанная система показателей была модифицирована. Были выбраны такие блоки показателей, как:

  1. Социально-экономические условия в регионе (основные макроэкономические показатели);

  2. Образовательный потенциал населения региона;

  3. Результативность исследований и разработок (кадровый и финансовый потенциал);

  4. Потенциал инновационной деятельности (активность в сфере технологических и нетехнологических инноваций, затраты на технологические инновации);

  5. Результативность инновационной деятельности.

Все используемые в данном исследовании показатели взяты из статистических сборников Федеральной службы государственной статистики [12, 13, 14] и НИУ ВШЭ [10], данные по всем показателям взяты в динамике за 4 года с 2007 по 2010гг. Далее, аналогично [11] определяются нормированные значения показателей по каждому региону как отношение разницы между значением показателя в регионе и минимального значения показателя по всем регионам к разнице между максимальным и минимальным значениями данного показателя по всем регионам.

Значение агрегированного показателя (блока из вышеуказанного списка) рассчитывается как среднее арифметическое нормированных значений показателей из данного блока. Полученные 5 значений характеризуют регион в разрезе развития науки, образования и инновационной деятельности и образуют признаковое описание объекта, которое нужно представить в системе параллельных координат [8], заменив точки в пятимерном пространстве признаков на ломаные. Эти ломаные, или кусочно-линейные функции, строятся следующим образом: на оси абсцисс откладываются номера показателей, которые характеризуют структуру объекта, ось ординат представляет собой ось значений этих показателей. Для каждого объекта мы имеем набор точек, соответствующий его структуре. Кусочно-линейная функция паттерна строится путем соединения этих точек прямыми линиями. Такая процедура производится для каждого объекта анализа.

Примеры полученных кусочно-линейных функции приведены на Рис. . Стоит отметить, что здесь и на всех последующих рисунках справа могут быть отмечены не все, а лишь часть регионов, представленных на рисунке.

Рис. – Кусочно-линейные функции, описывающие объекты, для 2008г.

Учитывая, что целью работы является динамический анализ поведения регионов, то полученные кусочно-линейные кривые для каждого года были объединены в общую выборку. Итого получилось 83х4=332 объекта для кластеризации.

Были использованы два метода кластеризации: k-средних и иерархический метод кластеризации, в каждом методе использовалась евклидова метрика. Мы проводили многошаговую процедуру кластерного анализа, комбинируя два вышеупомянутых метода. В результате было получено 24 паттерна данных, включающих более двух объектов внутри паттерна, и 24 уникальных паттерна (они представлены на одном, последнем рисунке). Для примера приведем первый паттерн (Рис. 3)

Рис. . – Первый паттерн данных

В него попали 11 ломаных, представляющих город Москву и Приморский край за все 4 года с 2007 по 2010гг, а также город Санкт-Петербург в 2007, 2009, 2010гг. Такой паттерн характеризуется умеренными (0,3-0,5) значениями первых двух показателей (Блок 1 «Социально- экономические условия» и Блок 2 «Образовательный потенциал»), черезвычайно высоким (0,5-0,9) показателем Блока 4 «Результативность исследований и разработок», а также очень низкими (менее 0,2) показателями Блоков 5 и 6, отвечающими за потенциал и результативность инновационной деятельности. Напомним, что все показатели в базовой системе представляют собой нормированные показатели – они либо приведены к численности экономически активного населения, либо представляют собой процентное отношение к общему показателю. Мы намеренно отказались от абсолютных показателей, имея целью исследовать внутреннюю структуру взаимной зависимости науки, образования и инновационной деятельности.

Далее был проведен динамический анализ паттернов, который позволяет отследить какому паттерну из вышеописанных каждый из регионов следовал в исследуемые 4 года на основе траекторий развития объекта. Траектория развития объекта – это определенное чередование паттернов, которое полностью описывает изменение направления развития объекта на рассматриваемом горизонте анализа. Примеры полученных траекторий развития регионов приведены на Рис. 4 и Рис. 5.

Рис. 4 – Траектории развития регионов Центрального федерального округа

в 2007-2010гг.
Рис. 5 – Траектории развития регионов Северо-Западного федерального округа

в 2007-2010гг.

В результате исследования были изучены характеристики регионов России по таким показателям как уровень социально-экономических условий, потенциал и результативность науки, образования и инновационной деятельности в динамике за 4 года с 2007 по 2010гг. Получена классификация регионов по схожести внутренней структуры указанных показателей, также построены траектории развития регионов с течением времени и найдены группы регионов, придерживающихся выбранной стратегии.

Список литературы:

  1. Aleskerov F., Alper C.E. Inflation, Money, and Output Growths: Some Observations // Bogazici University Research Paper, #SBE 96-06, 1996.

  2. Aleskerov F., Alper C.E. A clustering approach to some monetary facts: a long-run analysis of cross-country data // The Japanese Economic Review, v.51, no.4, 2000, 555-567.

  3. Aleskerov F., Ersel H., Gundes C., Minibas A., Yolalan R. Environmental Grouping of Bank Branches and their Performances // Yapi Kredi Discussion Paper Series, No: 97-03, 1997, Istanbul, Turkey

  4. Aleskerov F., Ersel H., Gundes C., Yolalan R. A Multicriterial Method for Personnel Allocation among Bank Branches // Yapi Kredi Discussion Paper Series, No:98-01, 1998, Istanbul, Turkey.

  5. Aleskerov F., Ersel H., Yolalan R. Multicriterial Ranking Approach for Evaluating Bank Branch Performance // International Journal of Information Technology and Decision Making, v.3, no.2, 2004, 321-335.

  6. Aleskerov F.T., Martynova Y.I., Solodkov V.M. Assessment and analysis of the efficiency of banks and banking systems // Proceedings of the 2d International Conference “Mathematical Modeling of Social and Economic Dynamic”, (MMSED - 2007), Moscow, 2007, 13-15 (ISBN 978-5-209-02632-7).

  7. Aleskerov F., Nurmi H. A Method for Finding Patterns of Party Support and Electoral Change: An Analysis of British General and Finnish Municipal Elections // Mathematical and Computer Modelling, 2008, 1225-1253.

  8. Few S. Multivariate Analysis Using Parallel Coordinates, 2006. Источник в Интернет: http://www.perceptualedge.com/articles/b-eye/parallel_coordinates.pdf

  9. Алексашин П.Г., Алескеров Ф.Т., Белоусова В.Ю., Попова Е.С., Солодков В.М. Динамический анализ бизнес-моделей российских банков в период 2006–2009 гг. Препринт WP7/2012/03; НИУ ВШЭ, М., 2012, 64 с.

  10. Индикаторы инновационной деятельности: 2008. Статистический сборник. – М.: ГУ-ВШЭ, 2008. – 424 с. Источник в Интернет: http://issek.hse.ru/news/49369377.html

  11. Рейтинг инновационного развития субъектов Российской Федерации: аналитический доклад / под ред. Л.М. Гохберга. – М.: Национальный исследовательский университет «Высшая школа экономики», 2012 – 104с.

  12. Статистический сборник Федеральной службы государственной статистики «Российский статистический ежегодник». Источник в Интернет: http://www.gks.ru/bgd/regl/b11_13/Main.htm

  13. Статистический сборник Федеральной службы государственной статистики «Обследование населения по проблемам занятости». Источник в Интернет: http://www.gks.ru/bgd/regl/b12_30/Main.htm

  14. Статистический сборник Федеральной службы государственной статистики «Регионы России. Социально-экономические показатели». Источник в Интернет: http://www.gks.ru/bgd/regl/b11_14p/Main.htm

Добавить документ в свой блог или на сайт

Похожие:

Анализ данных науки, образования и инновационной деятельности с использованием методов анализа паттернов iconМетодические рекомендации по изучению дисциплины «Анализ данных в...
«Анализ данных в социологии»: познакомился с основными направлениями анализа данных в социологии, осуществляемых с помощью математических...
Анализ данных науки, образования и инновационной деятельности с использованием методов анализа паттернов iconОпыт применения методов интеллектуального анализа данных в компаративистских...
В работе описываются предварительные результаты анализа данных из Базы данных “Языки мира” с применением методов DataMining и пакета...
Анализ данных науки, образования и инновационной деятельности с использованием методов анализа паттернов iconОтчет о лабораторной работе методы и средства анализа данных по теме:...
«Лабораторная работа с системой анализа данных Weka. Сравнение методов классификации»
Анализ данных науки, образования и инновационной деятельности с использованием методов анализа паттернов iconОтчет о лабораторной работе методы и средства анализа данных по теме:...
«Лабораторная работа с системой анализа данных Weka. Сравнение методов классификации»
Анализ данных науки, образования и инновационной деятельности с использованием методов анализа паттернов iconЛицензионный договор – публичная оферта о передаче неисключительных...
«Анализ данных в социологии»: познакомился с основными направлениями анализа данных в социологии, осуществляемых с помощью математических...
Анализ данных науки, образования и инновационной деятельности с использованием методов анализа паттернов iconАнализа данных-4: анализ издержки-выгод
Методы анализа данных-4: анализ издержки-выгоды, анализ издержки-эффективность (17 ноября 2005)1
Анализ данных науки, образования и инновационной деятельности с использованием методов анализа паттернов iconУчебно-методический комплекс по дисциплине учет и анализ: финансовый анализ
Виды финансового анализа. Бухгалтерский баланс как объект финансового анализа. Анализ финансовой устойчивости, ликвидности и платежеспособности...
Анализ данных науки, образования и инновационной деятельности с использованием методов анализа паттернов iconПрограмма по формированию навыков безопасного поведения на дорогах...
Нарративный анализ как один из методов дискурсивного анализа. Схема проведения нарративного анализа 41
Анализ данных науки, образования и инновационной деятельности с использованием методов анализа паттернов iconПроекта
Разработка моделей социальных явлений с помощью методов интеллектуального анализа данных
Анализ данных науки, образования и инновационной деятельности с использованием методов анализа паттернов iconРазработка методов и средств анализа и диагностирования объектов...

Анализ данных науки, образования и инновационной деятельности с использованием методов анализа паттернов iconИнновационной деятельности. Виды инноваций. Инновационные технологии....
Роль инноваций в жизни общества. История человечества как история важнейших инноваций. Этапы развития инновационной активности и...
Анализ данных науки, образования и инновационной деятельности с использованием методов анализа паттернов iconПрограмма по формированию навыков безопасного поведения на дорогах...
Подтвердить значимость и достоверность полученных в результате исследования данных можно с использованием статистических методов....
Анализ данных науки, образования и инновационной деятельности с использованием методов анализа паттернов iconАнализ работы шмо учителей естественнонаучного цикла за 2011-12 учебный год
Методы анализа: анализ документации мо, анализ анкетирования педагогов, Источники анализа
Анализ данных науки, образования и инновационной деятельности с использованием методов анализа паттернов iconКафедра экономического анализа и аудита учебные материалы для самостоятельной...
«Анализ финансово-хозяйственной деятельности» разработано в соответствии с требованиями Государственного образовательного стандарта...
Анализ данных науки, образования и инновационной деятельности с использованием методов анализа паттернов icon3. реферат базы данных на л в 1 экз
В отдел по вопросам интеллектуальной собственности Управления инновационной деятельности ниу вшэ
Анализ данных науки, образования и инновационной деятельности с использованием методов анализа паттернов icon3. реферат базы данных на л в 1 экз
В отдел по вопросам интеллектуальной собственности Управления инновационной деятельности ниу вшэ


Школьные материалы


При копировании материала укажите ссылку © 2013
контакты
100-bal.ru
Поиск