Применение информационных технологий для эконометрического анализа данных Выпускная работа по «Основам информационных технологий»





НазваниеПрименение информационных технологий для эконометрического анализа данных Выпускная работа по «Основам информационных технологий»
страница5/7
Дата публикации29.07.2013
Размер0.6 Mb.
ТипАвтореферат
100-bal.ru > Экономика > Автореферат
1   2   3   4   5   6   7



ГЛАВА 3


ПРАКТИЧЕСКОЕ ПРИМЕНЕНИЕ ИТ В ЭКОНОМЕТРИЧЕСКОМ АНАЛИЗА ЭКОНОМЕТРИЧЕСКИХ ДАННЫХ


3.1 Информационные технологии в эконометрических исследований
Потребность в средствах статистического анализа эконометрических данных в различных областях деятельности, особенно в науке, очень велика, что и послужило причиной развития рынка компьютерных программ для статистической обработки эконометрических данных. За последние 20 лет активное развитие получили компьютерные программы, позволяющие проводить статистический анализ больших объемов данных с целью выявления закономерностей, сравнения вероятных альтернатив выбора, построения прогнозов развития событий, обнаружения связей между явлениями и процессами. Существующие программы постоянно совершенствуются в части ускорения работы с данными, улучшения представления результатов анализа данных, повышения удобства интерфейса, совершенствования справочной системы, увеличения числа встроенных в программу статистических процедур, средств обработки данных и пр.

Отрасль развивается стремительными темпами. На сегодняшний день на рынке представлено около тысячи компьютерных программ для статистической обработки данных (далее – статистические пакеты). Разнообразие статистических пакетов обусловлено многоплановостью задач обработки данных с применением различных типов статистических процедур анализа для поиска ответов на вопросы из различных областей человеческой деятельности.

Рынок компьютерных программ для статистического анализа данных характеризуется высокой конкуренцией, нередки случаи консолидации и поглощений компаний-разработчиков. Например, один из самых активных игроков на рынке компания SPSS Inc. в 1994 г. поглотила компанию SYSTAT Software Inc., а в 1996 г. – BMDP Statistical Software Inc. Эти приобретения позволили компании усовершенствовать собственные программные продукты. В частности, поглощение BMDP Software позволило усилить графические инструменты представления данных в SPSS, а поглощение SYSTAT – технологии обработки и анализа данных, полученных при биологических и медицинских исследованиях. В 2009 году компания IBM Inc. поглотила компанию SPSS Inc.

На современном этапе невозможно представить эконометрическое исследование без применения информационных технологий. В настоящее время исследователю доступно большое количество разнообразных программных продуктов, которые могут быть использованы для решения эконометрических задач. Сюда относятся, естественно, и все статистические программные пакеты. Практика их использования позволила сформулировать следующие общие требования, предъявляемые к программному обеспечению, применяемому в эконометрических исследованиях:

  • наличие удобных средств для работы с исходными данными;

  • накопление и хранение эконометрических данных;

  • фильтрация и поиск информации;

  • предварительная обработка данных;

  • расчет статистических характеристик;

  • поддержка методов построения моделей взаимосвязей;

  • поддержка методов оценки адекватности моделей;

  • реализация методов анализа и моделирования временных рядов;

  • реализация методов прогнозирования;

  • реализация статистических критериев;

  • обеспечение возможности создания и сохранения сценария исследования, представляющего описание последовательно применяемых процедур;

  • визуализация промежуточных и конечных результатов исследования.

Удобный ввод данных подразумевает наличие средств копирования данных из других приложений (созданных другими программными продуктами) в табличном виде либо возможности загрузки данных из файлов стандартных форматов (.xml, .xls, .txt). Важное значение имеет также возможность графического представления исходных данных и результатов средствами 2D и 3D-графики.

В зависимости от типа данных и предполагаемого исхода модели исследователи выбирают тот или иной пакет. Перед пользователями различных категорий встает вопрос выбора оптимального статистического пакета для поиска верных ответов на существующие вопросы. Очевидно, что оптимальным является вариант, сочетающий в себе необходимые функциональные возможности, высокое качество работы и умеренную цену. При выборе пакета учитываются следующие параметры:

  • соответствие характеру решаемых задач;

  • объем обрабатываемых данных;

  • требования, предъявляемые к квалификации пользователя (уровень знаний в области статистики);

  • имеющееся в наличии компьютерное оборудование.

Применяемое в эконометрических исследованиях программное обеспечение можно разделить на следующие группы:

  • Программы, реализующие технологию электронных таблиц MS Excel, OpenOffice.org Calc и др. Данные программы используют представление данных в табличном виде и позволяют решать простейшие эконометрические задачи;

  • Статистические пакеты общего назначения: SPSS, STATISTIСA, STATGRAPHICS и др.;

  • Программы, ориентированные на решение эконометрических задач: Econometric Views, STADIA, Matrixer 3.4 и др.;

  • Специализированные статистические пакеты, предназначенные для решения ограниченного круга задач ЭВРИСТА, МЕЗОЗАВР, ОЛИМП, Forecast Expert и др.;

  • Математические пакеты общего назначения Mathcad, Matlab, Maple, Mathematica и др.

Все эконометрические программы различаются по организации диалога с пользователем (интерфейса) и способу представления данных:

  • библиотеки статистических процедур и численных методов для стандартных языков программирования и СУБД;

  • электронная таблица с системой меню;

  • командная строка и матрицы.

Статистические пакеты по признаку функциональности могут быть разделены на 3 основные группы.

  1. Универсальные пакеты, или пакеты общего назначения (например, SPSS, STATA, STATISTICA, S-PLUS, Stadia, STATGRAPHICS, SYSTAT, Minitab).

Эти пакеты не ориентированы на специфическую предметную область и могут применяться для анализа данных из различных областей деятельности. Как правило, они предлагают широкий диапазон статистических методов и имеют относительно простой интерфейс. С такими пакетами рекомендуется работать начинающим пользователям, владеющим лишь базовыми знаниями в области статистики, а также опытным пользователям на начальных этапах работы с данными, когда еще четко не определены статистические методы, которые будут применяться для решения того или иного вопроса. Многопрофильность универсального пакета позволяет провести пробный анализ различных типов данных с использованием широкого диапазона статистических методов. Большинство существующих универсальных пакетов имеют много пересечений по составу встроенных статистических процедур.

Для того чтобы статистический пакет считался универсальным, он должен удовлетворять ряду требований:

  • содержать достаточно широкий набор стандартных статистических методов;

  • быть достаточно простым для быстрого освоения и использования непрофессиональным пользователем;

  • работать с достаточно большими базами данных и отвечать высоким требованиям к вводу, преобразованию и организации хранения данных;

  • осуществлять обмен данными с широко распространенными пакетами и базами данных;

  • иметь обширный набор средств графического представления данных и результатов их анализа;

  • иметь подробное документационное сопровождение и справочную систему, позволяющую начинающему пользователю с легкостью находить ответы на вопросы, связанные с работой программы и возможностями применения средств анализа данных.

  1. Профессиональные пакеты (например, SAS, BMDP).

Профессиональные пакеты отличаются от универсальных тем, что позволяют работать со сверхбольшими объемами данных, применять узкоспециализированные методы анализа, создавать собственную систему обработки данных. Как правило, подобные пакеты сложны в освоении для непрофессионалов. В то же время подготовленным пользователям работа с профессиональным пакетом предоставит больше возможностей для глубокого и детального анализа данных, построения сложных моделей и адаптации системы к собственным потребностям. Профессиональные пакеты более дорогостоящи, чем универсальные. Например, стоимость покупки SAS Analytics Pro на один год для индивидуального пользования составляет 5 360 EUR. Эти факторы делают современные профессиональные статистические пакеты слишком тяжеловесными для массового применения в различных областях деятельности.

  1. Специализированные пакеты (например, BioStat, MESOSAUR, DATASCOPE).

В некоторых областях деятельности анализируемые данные настолько специфичны, что к ним следует применять особые методы статистического анализа, как правило, не представленные в универсальных пакетах.

Специализированные пакеты позволяют проводить анализ с использованием ограниченного числа специализированных статистических методов или применимы к использованию для решения вопросов, относящихся к отдельно взятой предметной области. Как правило, с подобными статистическими пакетами работают специалисты, хорошо знакомые с методами анализа данных в той области, на которую ориентирован пакет. Так, статистический пакет BioStat создан для анализа данных в области биологии и медицины и будет подробнее рассмотрен ниже. Российский статистический пакет MESOSAUR специализируется на анализе одномерных и многомерных временных рядов и построении регрессионных моделей. Еще один российский статистический пакет DATASCOPE специализируется на проведении анализа многомерных данных.

Целесообразно пользоваться соответствующими специализированными пакетами, когда требуется систематически решать задачи из конкретной области или применять ограниченный круг сложных статистических процедур для анализа данных из нескольких областей человеческой деятельности.

Большинство представленных на рынке статистических пакетов обладают гибкой модульной структурой, которая может пополняться и расширяться за счет пользовательских модулей, дополнительно закупаемых или находящихся в свободном доступе в Интернете. Подобная гибкость позволяет адаптировать большинство пакетов к потребностям конкретного пользователя.

По мнению профессионалов, статистический пакет должен удовлетворять следующему минимальному набору требований:

  • модульность;

  • ассистирование при выборе способа обработки данных;

  • использование простого проблемно-ориентированного языка для формулировки задания пользователя;

  • автоматическая организация процесса обработки данных;

  • ведение банка данных пользователя и составление отчета о результатах проделанного анализа;

  • диалоговый режим работы пользователя с пакетом;

  • совместимость с другим программным обеспечением.

Как правило, представленные на рынке статистические пакеты регулярно обновляются. При этом в новой версии сохраняются или совершенствуются возможности предыдущей, а также добавляются новые возможности работы с данными. В большинстве случаев обновленные версии пакета сохраняют исходное название, изменяется лишь порядковый номер, присваиваемый конкретной версии. Самые распространенные пакеты имеют русскоязычную версию.

Разработчики большинства статистических пакетов часто утверждают, что разработанная ими программа является наилучшей для обработки данных. Учитывая многообразие предложения, подчас бывает сложно сделать правильный выбор. По мнению М. Митчелла, имеющего 20-летний опыт работы со статистическими пакетами и 11-летний опыт работы в качестве консультанта по статистике в Калифорнийском университете в Лос-Анджелесе, статистический пакет – всего лишь инструмент в руках мастера. Если специалист не обладает достаточными знаниями и компетенциями, то даже самый совершенный программный продукт не позволит провести качественный анализ данных. В то же время неправильно подобранный пакет, не обладающий необходимыми для анализа техническими характеристиками, способен замедлить работу даже выдающегося ученого, затруднив выявление необходимых закономерностей и получение верных результатов анализа данных.

3.2 Программное обеспечение для анализа эконометрических данных
В эконометрическом моделировании существует достаточно большой выбор пакетов, с помощью которых можно моделировать как макроэкономические, так и микроэкономические данные. Выбор пакетов связан с предпочтениями исследователя и типов данных, с которыми приходится работать [cм. таблицу 3.1].
Таблица 3.1 – Программные пакеты для анализа эконометрических данных

Универсальные пакеты или пакеты общего назначения

Профессиональные пакеты

Специализированные пакеты

SPSS, STATA, STATISTICA, Stadia, STATGRAPHICS, Minitab

SAS

BioStat


Необходимо отметить, что существует минимальный набор статистических методов анализа, который включен во все рассмотренные пакеты:

  • описательная статистика (базовые статистические методы, проверка нормальности распределения данных);

  • дисперсионный анализ;

  • непараметрическая статистика (анализ таблиц сопряженности, непараметрические сравнения, дисперсионный анализ);

  • контроль качества;

  • анализ выживаемости;

  • кластерный анализ;

  • факторный анализ;

  • дискриминантный анализ;

  • регрессионный анализ;

  • обработка данных (сортировка, отбор, трансформация данных).

Рассмотрим подробнее наиболее известные пакеты программного обеспечения для анализа эконометрических данных.

Пакет Stata – универсальный статистический пакет компании StataCorp. Первая версия пакета была выпущена в 1985 г. На сегодняшний день разработана 11-я версия пакета (Stata 11).

Пакет Stata позиционируется как инструмент анализа, предназначенный для специалистов, которые занимаются научными исследованиями. По мнению разработчиков, благодаря гибкой модульной структуре пакет применим для анализа данных из различных областей знаний: общественные науки (экономика, политология и пр.), медицина (биостатистика, эпидемиология и пр.) и т. д.

Stata предоставляет пользователям следующие возможности статистического анализа данных:

  • динамические факторные модели, линейные, обобщенные линейные модели и нелинейные модели, многоуровневые смешанные модели, модели выбытия;

  • обобщенные оценки уравнений (GEE);

  • непараметрические методы, методы повторных выборок и статистического эксперимента;

  • проверка гипотез и работа с оцененными моделями;

  • максимизация функций правдоподобия, заданных пользователем;

  • матричные команды.

Предлагаются четыре различных решения при установке Stata.

  1. Stata/IC (Intercooled) представляет собой стандартную версию пакета.

  2. Stata/SE позволяет работать с более обширными базами данных по сравнению со стандартной версией.

  3. Stata/MP представляет собой самую быструю и широкую версию Stata. Обладает продвинутыми многопроцессорными возможностями и работает быстрее, чем все другие версии пакета.

  4. Small Stata используется в образовательных целях.

В таблице 3.2 представлены возможности четырех версий пакета Stata в части объема анализируемых данных.

Таблица 3.2 – Возможности различных версий пакета Stata в части объема анализируемых данных

Версия статистического пакета Stata

Максимальное число переменных

Максимальное число наблюдений

Stata/MP

32 767

Ограничено лишь объемом опера тивной памяти компьютера, на котором установлен пакет

Stata/SE

32 767

Stata/IC

2 047

Small Stata

99

1 200


Достоинства Stata:

  • широкий набор средств статистического анализа данных;

  • широкий спектр возможностей по управлению данными (возможности комбинирования и изменения наборов данных, управления переменными и пр.);

  • возможность программирования всей последовательности команд (начиная от загрузки данных до проведения всех этапов их анализа);

  • использование координатного указателя;

  • интерактивный справочник;

  • создание графики полиграфического качества;

  • возможность написания собственных программных модулей;

  • совместимость с операционными системами Windows, Macintosh и Unix (включая Linux);

  • полное документационное сопровождение ("Базовое справочное руководство" с более чем 1800 страницами информации, содержащее подробные примеры и ссылки на литературу по статистике);

  • экспорт результатов в MS Office и SAS;

  • для работы программы требуется лишь 512 MB оперативной памяти, сама программа занимает 250 MB на жестком диске компьютера;

  • возможность запуска команды, как через соответствующий пункт меню, так и через написание команды в командной строке

  • мощная поддержка как со стороны производителя, так и со стороны других пользователей.

Недостатки Stata:

  • отсутствие возможности полноценного экспорта и импорта данных в базы данных, электронные таблицы и текстовые процессоры;

  • возможность прямого открытия в программе лишь файлов с разрешением .dta.

В ежеквартальном журнале Stata Journal (http://www.stata-journal.com) публикуются статьи, посвященные вновь разрабатываемым функциям и возможностям анализа данных в статистическом пакете Stata. Интернетресурс Statalist (http://www.stata.com/statalist) представляет собой независимый сервер, на котором более 2500 пользователей поддерживают диалог по широкому кругу вопросов, связанных с работой со статистическими пакетами и анализом статистических данных, в частности, по вопросам работы со Stata.

На рисунке 3.1 представлено диалоговое окно Stata. Оно разделено на 4 основные области.

  1. Область Обзор (Review) отображает историю выполненных в сеансе команд и позволяет пользователю сохранять команды для последующего использования.

  2. Область Переменные (Variables) отображает название, метку, тип и формат переменных находящихся в открытой базе данных.

  3. Область Результат (Result) отображает результаты проведенного анализа и журнал событий.

  4. Область Команды (Command) предназначена для написания команд пользователями.


диалоговое окно stata

Рисунок 3.1Диалоговое окно STATGRAPHICS
Внешний вид Stata несколько отличен от того, что обычно можно увидеть в других статистических пакетах. Внешний аскетизм интерфейса унаследован от идеологии командной строки UNIX, и пользователю Windows требуется некоторое привыкание.

Stata использует в работе несколько окон: окно ввода команд (Stata Command), окно вывода результатов (Stata Results), окно истории, или предыдущих команд (Review), окно переменных (Variables), окно поиска и помощи (Help), графический экран (Graph), окно файла-протокола, или log-файла.

При вводе команд в окне Stata Command можно пользоваться стандартными средствами редактирования в Windows (выделения, стирания, вставки в буфер и из буфера). Можно вызывать предыдущие команды, нажимая PgUp и PgDn, и редактировать их (что очень полезно, если при вводе команды были допущены мелкие опечатки, или если надо добавить какие-то опции или условия к предыдущей команде). Можно менять кое-какие установки Stata в меню Prefs, например, сохранить текущие установки окон (размеры, положение, шрифты).

В пакете Stata имеется широчайший спектр статистических команд, важных для эконометрического анализа:

  • регрессия с инструментальными переменными, робастная регрессия, одновременные уравнения, нелинейный МНК;

  • модели временных рядов: модели авторегрессии со скользящими средними;

  • автокорреляции и частные автокорреляции; модели с условной гетероскедастичностью;

  • обобщенные линейные модели;

  • средства дисперсионного анализа;

  • средства факторного анализа и анализа главных компонент;

  • средства анализа таблиц сопряженности;

  • средства анализа панельных моделей;

  • средства анализа данных типа длительностей, или времени жизни, или времени отказа;

  • средства анализа стратифицированных обследований;

  • средства анализа моделей с бинарной зависимой переменной;

  • тесты на равенство средних, дисперсий и медиан;

  • ранговые корреляции;

  • возможность максимизации функций правдоподобия, запрограммированных пользователем.

Версии Stata существенно различаются по своим возможностям в том, что касается анализа панельных данных. Например, в Stata-7 становится доступным оценивание панельных регрессий методом инструментальных переменных, и появляется макрос для оценивания динамиче-ских моделей. В Stata-8 реализована процедура Хаусмана-Тейлора.

Непосредственное применение ЭП Stata для моделирования детерминант экономического развития будет сопряжено с рядом процедур:

  1. выбор стран, по которым эконометрическое моделирование будет проводится. Наиболее целесообразным представляется оценить Республику Беларусь и государства-соседи, например, Россию и Украину;

  2. далее выбор показателей. В исследование будет проведено на базе подхода креативности. Идея индекса креативности строится на теории «Трех Т»: Талант, Технологии и Толерантность, необходимых для успешного экономического развития по мнению Р. Флориды, американского географа-экономиста. В исследовании будет сделана попытка соответствующего анализа на основании данных по вышеперечисленным странам;

  3. следующим логическим этапом в разработке данного исследование будет сбор данным по выбранным показателям за максимально возможный промежуток времени;

  4. составление таблицы панельных данным и загрузка данных в программу для дальнейшей оценки;

  5. моделирование данных с помощью ЭП и оценка полученной модели: проверка состоятельности, несмещенности и эффективности коэффициентов, проверка общего качества модели, определение объясненных и необъясненных ошибок модели.

  6. проверка и решение таких проблем, как: гетероскедостичность, мультиколлинеарность, автокорреляция и эндогенность.

В результате проделанной работы, можно будет сделать вывод о том, действительно ли выбранные факторы оказывают непосредственное влияние на экономическое развитие государства или региона.

Пакет SРSS (Statistical Package for the Social Sciences) – универсальный статистический пакет компании SРSS Inc. Первая версия пакета была выпущена в 1968 г. В 2009 г. компания IBM поглотила SPSS Inc., поэтому новая версия пакета включает в свое название аббревиатуру IBM (IBM SPSS Statistics 19).

По мнению разработчиков пакета, SPSS является одним из лидирующих программных продуктов в области статистического анализа данных для решения вопросов в правительственной, академической и бизнес сфере.

SРSS является модульной программой. Ее основу составляет базовый модуль (SPSS Base), позволяющий осуществлять управление данными и содержащий наиболее распространенные методы статистического анализа данных: проведение описательной статистики; построение линейных и нелинейных моделей; осуществление преобразования данных; проведение факторного, кластерного, дисперсионного анализов; вычисление корреляций; построение графиков; подготовка отчетов и пр.

Для проведения расширенного и углубленного анализа данных могут быть установлены дополнительные модули пакета. Для пакета IBM SPSS Statistics 19 разработаны 16 различных модулей. Например, модуль IBM SPSS Advanced Statistics предназначен для проведения анализа сложных взаимосвязей при помощи процедур, учитывающих свойства исследуемых данных, что позволяет продвинуться за рамки базового анализа данных. В модуль встроены мощные инструменты построения моделей. Модуль IBM SPSS Bootstrapping («Самогенерация») позволяет аналитикам проверять устойчивость построенных моделей, а модуль IBM SPSS Direct Marketing («Прямой маркетинг») предоставляет возможность маркетологам самостоятельно выполнять основные виды анализа. Модуль IBM SPSS Data Entry автоматизирует процесс разработки анкеты и ввода результатов опросов.

Достоинства SPSS:

  • развитый аппарат статистического анализа;

  • универсальность (может быть использован для решения широкого круга вопросов из различных предметных областей, требующих проведения статистического анализа данных);

  • широкий набор статистических и графических процедур (более 50 типов диаграмм) анализа данных, а также процедур создания отчетов;

  • высокая скорость вычислений, простой и удобный интерфейс;

  • детальная контекстно-ориентированная справочная система, позволяющая неопытному пользователю с большей легкостью ориентироваться в программе;

  • возможность свободного скачивания демонстрационной версии продукта на официальном сайте компании, наличие версий продукта на различных языках;

  • совместимость с операционными системами Windows, Mac, Linux;

  • наличие значительного количества литературы по работе с пакетом.

Недостатки SPSS:

  • высокие требования к системе компьютера (требуется 1GB оперативной памяти, 800MB памяти на жестком диске и процессор с частотой 1GHz и выше);

  • высокая цена по сравнению со статистическими пакетами аналогичного уровня (стоимость покупки для индивидуального пользования сроком на год составляет около 1000 долл.).

  • Последняя версия SPSS включает в себя следующие новые возможности:

  • импорт данных из Excel и SAS;

  • экспорт результатов в MS Office, PDF; сохранение результатов в формате HTML;

  • одновременная работа с несколькими наборами данных;

  • построение диаграммы для переменных с множественными ответами;

  • построение диаграммы с двумя осями Y;

  • улучшенный редактор синтаксиса с поддержкой автозавершения и цветового кодирования команд;

  • быстрая подготовка данных к анализу посредством Автоматизированной подготовки данных (IBM SPSS Data Preparation), позволяющей облегчить процесс интеллектуального анализа данных, выявляя и исправляя ошибки в данных и объясняя пропущенные значения. Также посредством этой функции можно подготовить отчет с рекомендациями о возможности использования данных для анализа.

На рисунке 3.2 представлено окно редактора данных SPSS.

окно редактора данных spss




Рисунок 3.2– Окно редактора данных SPSS
В левом нижнем углу окна расположены две вкладки: Данные (Data View) и Переменные (Variable View), позволяющие переключаться с режима просмотра значений переменных в режим просмотра их характеристик.

Результаты статистического анализа приводятся в диалоговом окне под названием Вывод.

окно вывода spss

Рисунок 3.3– Окно редактора данных SPSS
Пакет Minitab – универсальный статистический пакет, разработанный Государственным университетом Пенсильвании в 1972 году. Выпускается компанией Minitab Inc. Последняя версия Minitab 16 позиционируется разработчиками как статистический пакет для аналитической работы на современных предприятиях. Версия представлена на семи различных языках (английском, французском, немецком, японском, корейском, китайском и испанском).

Программа предоставляет пользователям следующие возможности статистического анализа данных:

  • управление процессом статистической обработки данных;

  • оценка мощности и объема выборки;

  • планирование экспериментов;

  • матричные функции;

  • анализ измерительных систем, анализ надежности/выживаемости, анализ временных рядов и прогнозирование, многомерный анализ.

Достоинства Minitab:

  • система консультационной поддержки пользователя (интерактивное дерево принятия решений позволяет отыскать правильный подход к анализу данных для поиска ответа на поставленные вопросы), настройка меню и панелей инструментов для быстрого доступа к используемым методам;

  • интерпретация полученных результатов;

  • осуществление импорта данных из текстовых и табличных процессоров, HTML-файлов, сохранение результатов анализа в форматах TIFF, JPEG, PNG, BMP, GIF, EMF;

  • удобный инструмент для размещения нескольких графиков на одной странице, автоматическое обновление графиков при изменении исходных данных, создание и вращение трехмерных графиков;

  • автоматизация заданий и создание новых функций с помощью языка макропрограммирования;

  • для работы программы требуется лишь 512 MB оперативной памяти, сама программа занимает 160 MB на жестком диске компьютера;

  • работа с файлами, содержащими до 4000 переменных и неограниченное число наблюдений.

Основной недостаток Minitab – несовместимость с операционными системами, отличными от Windows.

На рисунке 3.4 представлено диалоговое окно Minitab. Оно разделено на 3 основные области.

диалоговое окно minitab
Рисунок 3.4– Диалоговое окно Minitab


  1. Окно сеанса (Session) содержит результаты анализа в виде текста. Кроме того, в нем можно вводить выполняемые команды вручную.

  2. Окно данных (Worksheet) представляет собой рабочий лист, напоминающий электронную таблицу. Можно одновременно использовать несколько рабочих листов, каждый из них откроется в отдельном окне данных.

  3. Окно редактора ReportPad, в который можно добавить результаты, полученные во время сеанса работы с программой Minitab. Выполняет функции простейшего текстового редактора. Позволяет быстро распечатать отчет и сохранить его в формате RTF или HTML.

Графики отображаются в отдельных окнах.

Пакет STATISTICA – универсальный статистический пакет компании StatSoft Inc1. Первая версия пакета (STATISTICA for DOS) была выпущена в 1991 г. На сегодняшний день разработана 9-я версия пакета (STATISTICA 9). Русифицирована только 6-я версия (STATISTICA 6).

Стандартную комплектацию пакета STATISTICA составляют три модуля, которые могут приобретаться как единым пакетом, так и отдельно.

  1. Базовый пакет STATISTICA Base предоставляет обширные возможности выбора основных типов статистического анализа. Для эффективной работы базового пакета требуется как минимум 256 MB оперативной памяти. Минимальные требования к скорости процессора – 500 MHz.

  2. Модуль Линейные и Нелинейные Модели (Advanced Linear/NonLinearModels) содержит большой набор инструментов для моделирования и прогнозирования, включая возможности автоматического выбора модели и расширенные интерактивные средства визуализации.

  3. Модуль Многомерные разведочные технологии анализа (Multivariate Exploratory Techniques) служит для применения разведочного анализа различных типов данных в сочетании с интерактивными средствами визуализации.

Помимо общих статистических и графических средств в системе имеются специализированные модули, например, для проведения социологических или биомедицинских исследований, решения технических и промышленных задач, – карты контроля качества, модули анализа процессов и планирования эксперимента.

Разработчики STATISTICA утверждают, что пакет может применяться для решения задач в таких областях, как:

  • НИОКР, контроль качества, процесс мониторинга в химической, фармацевтической промышленности и в производстве потребительских товаров;

  • гарантийный анализ и приложения для удаленного мониторинга в обрабатывающей промышленности;

  • анализ рисков, сегментация потребителей и оценка кредитоспособности заемщиков в банковской сфере, в сфере предоставления финансовых услуг и в страховой деятельности.

  • Возможны различные варианты установки пакета в зависимости от целей и задач пользователя:

  • однопользовательская версия (Single-User);

  • сетевая версия (Concurrent Network) для работы в локальных вычислительных сетях;

  • Enterprise – версия для применения в вычислительных системах и крупных организациях

  • Web-Based – версия для использования в крупных сетях через веббраузер.

Пакет предоставляет пользователям следующие возможности статистического анализа данных:

  • исследование корреляций между переменными;

  • диаграмма рассеяния, матричная диаграмма рассеяния;

  • быстрые основные статистики и блоковые статистики (интерактивные средства, позволяющие одним щелчком мыши вычислять основные статистики и строить графики в любой момент в течение сеанса работы);

  • интерактивный калькулятор вероятностных распределений (позволяет интерактивно исследовать структуру распределений, например, зависимость вероятности от параметров);

  • анализ многомерных откликов, многомерное шкалирование;

  • анализ при помощи временных рядов и прогнозирование временных зависимостей, в том числе анализ сезонных колебаний.

Достоинства STATISTICA:

  • реализован обмен данными между STATISTICA и Windows-приложениями;

  • результаты анализа в виде графиков, таблиц и текста могут быть сохранены в файле с форматом RTF, который открывается и редактируется в MS Word;

  • возможность расширения системы при помощи создания программ на встроенном в STATISTICA языке программирования;

  • исходные данные из MS Excel можно легко импортировать в STATISTICA;

  • возможность записи макросов для автоматизации выполнения однотипных задач;

  • программа способна обрабатывать большие массивы данных – базы данных с числом переменных до 32 000 и практически неограниченным числом наблюдений.

В пакете представлены несколько сотен типов графиков 2D, 3D и 4D, матрицы и пиктограммы; предоставляется возможность разработки собственного дизайна графика. Средства управления графиками позволяют работать одновременно с несколькими графиками, изменять размеры сложных объектов, добавлять художественную перспективу и ряд специальных эффектов, разбивку страниц и быструю перерисовку. Например, 3D-графики можно вращать, накладывать друг на друга, сжимать или увеличивать. Внешний вид диалогового окна STATISTICA представлен на рисунке 3.5.

диалоговое окно statistica


Рисунок 3.5 - Диалоговое окно STATISTICA
STATISTICA обладает огромными возможностями для построения графиков непосредственно из таблиц исходных данных и таблиц результатов. Построение графических объектов и анализ данных в пакете тесно интегрированы. После получения результатов статистического анализа их можно с легкостью представить графически посредством команды Быстрые статистические графики. В разных модулях системы имеются свои специальные графики, учитывающие особенности получаемых в них результатов. Начинающие пользователи могут начать работу со специальной версии, разработанной для обучения основам статистических методов – Studеnt Еditiоn оf STATISTICA. Эта версия представляет собой урезанный вариант пакета и позволяет анализировать файлы данных, включающих не более 400 наблюдений.

Пакет STATGRAPHICS (STATistical GRAPHICs System) – универсальный статистический пакет компании Manugistics Inc. Первая версия пакета была выпущена в середине 80-х годов. На сегодняшний день разработана 5-я версия пакета Statgraphics Plus 5.1.

Достоинства STATGRAPHICS:

  • сочетание научных методов обработки разнотипных данных с возможностью создания современной высококачественной интерактивной графики;

  • широкие возможности взаимодействия с другими программными продуктами (электронными таблицами, базами данных);

  • высококачественная двумерная и трехмерная графика, интегрированная графика, предполагающая, что все элементы графических представлений результатов анализа могут быть преобразованы. После завершения процедуры статистического анализа данных можно выбрать графические отображения результатов, релевантные используемой процедуре анализа. Внешний вид диалогового окна STATGRAPHICS представлен на рисунке 3.6.

диалоговое окно biostat

Рисунок 3.6– Диалоговое окно STATGRAPHICS
В STATGRAPHICS графика из средства презентации результатов анализа превращается в аналитический инструмент: можно идентифицировать точку на графическом отображении и выяснить ее местонахождение в файле данных или вращать и рассматривать с разных сторон трехмерные изображения, осуществлять разгонку точек на диаграммах рассеяния и т. п.

В STATGRAPHICS существует возможность сохранения результатов работы и создания собственных статистических проектов. После завершения анализа пользователь может сохранить последовательность выбранных методов, параметры статистических процедур, виды графических отображений результатов анализа, табличные формы, комментарии и пр. в отдельном файле. Сохраненную схему анализа можно будет автоматически применять к другому множеству данных.




1   2   3   4   5   6   7

Похожие:

Применение информационных технологий для эконометрического анализа данных Выпускная работа по «Основам информационных технологий» iconВыпускная работа по «Основам информационных технологий»
Реферат: «Применение информационных технологий в исследовании и описании безэквивалентной лексики» 6
Применение информационных технологий для эконометрического анализа данных Выпускная работа по «Основам информационных технологий» iconВыпускная работа по «Основам информационных технологий»
«Применение информационных технологий в географии на примере оценки недвижимости» 5
Применение информационных технологий для эконометрического анализа данных Выпускная работа по «Основам информационных технологий» iconПрименение информационных технологий на уроках английского языка...
Возможности использования информационно-коммуникативных технологий в обучении английскому языку 17
Применение информационных технологий для эконометрического анализа данных Выпускная работа по «Основам информационных технологий» iconВыпускная работа по «Основам информационных технологий»
Реферат по ит в предметной области: «Применение информационных и коммуникационных технологий в обучении иностранному языку» 4
Применение информационных технологий для эконометрического анализа данных Выпускная работа по «Основам информационных технологий» iconВыпускная работа по «Основам информационных технологий»
Перспективы использования ит для поиска и анализа данных о Дж. Р. Р. Толкине и его творчестве 9
Применение информационных технологий для эконометрического анализа данных Выпускная работа по «Основам информационных технологий» iconПрименение информационных технологий на уроках истории и обществоведения...
Возможности использования информационно-коммуникативных технологий в обучении истории 17
Применение информационных технологий для эконометрического анализа данных Выпускная работа по «Основам информационных технологий» iconВероника Игоревна Использование информационных технологий в гуманитарных...
Мвц межвузовский центр новых информационных технологий в гуманитарном образовании
Применение информационных технологий для эконометрического анализа данных Выпускная работа по «Основам информационных технологий» iconПрименение информационных технологий в переводоведении (японский...
...
Применение информационных технологий для эконометрического анализа данных Выпускная работа по «Основам информационных технологий» iconПрименение информационных технологий в исследованиях поэтических...
Применение информационных технологий в исследованиях поэтических особенностей стиля Ю. Левитанского 12
Применение информационных технологий для эконометрического анализа данных Выпускная работа по «Основам информационных технологий» iconВыпускная работа по «основам информационных технологий»
Реферат по теме: применение информационной технологий в преподавании русского языка 4
Применение информационных технологий для эконометрического анализа данных Выпускная работа по «Основам информационных технологий» iconВыпускная работа по «Основам информационных технологий»
Применение ит для расчета и анализа прохождения импульсного сигнала через дифференциальный измерительный трансформатор тока (Пояс...
Применение информационных технологий для эконометрического анализа данных Выпускная работа по «Основам информационных технологий» iconПрименение информационных технологий в изучении истории древнего...
Применение информационных технологий в изучении истории древнего мира в 5-ых классах
Применение информационных технологий для эконометрического анализа данных Выпускная работа по «Основам информационных технологий» iconВыпускная работа по «Основам информационных технологий»
Место и роль информационных технологий при формировании туристического продукта 6
Применение информационных технологий для эконометрического анализа данных Выпускная работа по «Основам информационных технологий» iconВыпускная работа по «Основам информационных технологий»
Использование информационных технологий в преподавании русского языка как иностранного
Применение информационных технологий для эконометрического анализа данных Выпускная работа по «Основам информационных технологий» iconВыпускная работа по «Основам информационных технологий»
Классификация информационных технологий, используемых при подготовке проектов нормативных правовых актов 6
Применение информационных технологий для эконометрического анализа данных Выпускная работа по «Основам информационных технологий» iconВыпускная работа по «Основам информационных технологий»
Использование информационных технологий в международных автомобильных перевозках 3


Школьные материалы


При копировании материала укажите ссылку © 2013
контакты
100-bal.ru
Поиск