Тема 5 . Анализ результатов исследования. (3 ч.) 1. Методы анализа данных Вопросы: - Сбор и анализ данных, этапы анализа
- Редактирование и кодирование.
- Одномерная и перекрестная табуляция.
- Выбор стратегии анализа данных.
- Классификация статистических методов обработки данных.
- Факторный и кластерный анализ.
- Многомерное шкалирование и совместный анализ. Сбор данных – наиболее трудоёмкая проблема реализации плана исследований. Полевые работы проводят на четвертом этапе процесса маркетинговых исследований.
На качество полученных ответов могут повлиять личные качества, опыт, мнение, восприятие, ожидания и отношение интервьюера. Именно поэтому интервьюеры должны соответствовать нескольким обязательным требованиям:
быть коммуникабельными;
уметь слушать и слышать;
не иметь речевых дефектов;
вызывать доверие у респондентов;
быть ответственными и обязательными;
ориентироваться в продукции / услугах компании.
При этом специалисты и практики в области маркетинговых исследований выработали рекомендации при проведении опроса:
Тщательно изучите содержание анкеты.
Задавайте вопросы точно в том порядке, в котором они включены в анкету.
Используйте только формулировки анкеты.
Зачитывайте вопросы медленно.
Повторите вопрос, если респондент не понял его.
Задайте все необходимые вопросы.
Точно выполняйте инструкции, следуйте разработанному образцу пропусков, тщательно выполняйте рекомендации относительно стимулирования ответов.
Кроме этого существуют также некоторые приемы для стимулирования ответов респондентов: повторение вопроса, повторение ответа респондента, использование паузы или молчание, подбадривание респондента, получение пояснений, использование объективных вопросов и комментариев. После опроса интервьюер должен ответить на все вопросы респондента относительно проекта исследования. У респондента должно остаться положительное впечатление об интервью. Очень важно поблагодарить респондента и выразить свою признательность за сотрудничество.
Контроль за работой полевого персонала напрямую влияет на качество полученных данных. Выделяют четыре типа контроля:
1) контроль качества ведения интервью и редактирования;
2) выборочный контроль;
3) контроль для предотвращения мошенничества (за фальсификацией ответов на некоторые или на все вопросы анкеты);
4) контроль из центрального офиса.
Важным аспектом контроля является выборочный контроль, в ходе которого проверяется, следуют ли интервьюеры плану выборочного опроса, а не выбирают единицы выборки по принципу их удобства или доступности. Для решения проблем данного типа контролеры должны ежедневно регистрировать количество сделанных звонков или посещений, отмечать, сколько из них осталось без ответа из-за отсутствия потенциальных респондентов, сколько людей отказались отвечать, сколько опросов провел каждый отдельный интервьюер и каково общее количество интервьюеров, находящихся под его контролем.
Ламбен Ж.Ж. выделяет две фазы сбора данных: предварительное тестирование и основное исследование. На предварительной фазе используется малая выборка и определяется, правильно ли выбраны методы сбора данных для основного исследования. Принципиальная проблема этого этапа – уменьшение величины ошибки (невыборочной), включая ошибки как респондентов, сборщиков информации, в том числе фальсификации данных каждой из сторон. Контроль качества сбора данных может быть включён в технологию сбора данных (например, с использованием вопросов и шкал лживости ответов) или быть внешним, то есть осуществляться как путём надзора за процессом, так и за счёт его дублирования.
С развитием телекоммуникаций и вычислительной техники методы сбора данных быстро меняются. В качестве примеров новых методов можно назвать опросы по телефону с вводом данных в компьютер, интервьюирование посредством компьютерных сетей, интерактивные терминалы в торговых центрах, интервьюирование по факсу, регистрацию универсальных кодов продуктов на электронных кассовых машинах и др. Все они ускоряют процесс сбора данных и одновременно уменьшают вероятность ошибок.
Источниками ошибок при проведении исследований могут быть:
неверный выбор математического метода анализа (методы математической статистики, технико-экономического анализа, исследования операций);
субъективность ответов респондентов (отвечают не то, что есть на самом деле, а то, что от них ждут);
пристрастное или искаженное формирование выборки респондентов;
искажение информации при ее передаче (различная интерпретация понятий);
некорректная или пристрастная постановка вопросов и составления опросных листов;
различная степень добросовестности и объективности исследователей и респондентов;
респонденты с определенным типовым характером ответов;
различия качества ответов для разных категорий респондентов;
недостаток времени для исследований.
Ошибки, допущенные на этапе сбора информации, напрямую влияют на результаты исследования. Типичными проблемами сбора данных являются:
ошибки в выборке: различие между наблюдаемыми значениями количественного признака и их долгосрочным средним значением при повторении измерений. Ошибка в выборке может быть уменьшена путем увеличения выборки;
систематические ошибки: ошибка исследования, не связанная с выборкой. Может быть вызвана концептуальными или логическими ошибками, неправильной интерпретацией ответов, а также статистическими, арифметическими, табуляционными, кодовыми или отчетными ошибками.
Систематические ошибки подразделяют на случайные и неслучайные. Случайные ошибки дают оценки, отличные от истинного значения; они приводят к отклонению в большую или меньшую сторону и имеют при этом случайный характер. Неслучайные ошибки приводят к односторонним отклонениям; для них характерна тенденция к смещению выборочного значения относительно параметра совокупности. Систематические ошибки могут быть также классифицированы по типам ошибок: ошибки ненаблюдения и ошибки наблюдения (рисунок 1).
Ошибки ненаблюдения
Ошибки наблюдения
Систематические ошибки
Неполучение данных
Ошибка сбора данных
Ошибка обработки данных
Отсутствие
Отказ от интервью
Неохват
Рисунок 1. Типы систематических ошибок
После того как данные собраны, их необходимо перевести в формат, отвечающий на вопросы исследователя, что отвечает понятию обработка и анализ данных. Эта деятельность составляет пятый этап маркетинговых исследований. Перед тем как передать исходные данные, содержащиеся в анкетах, для статистического анализа, их необходимо преобразовать в подходящую для анализа форму. Качество статистических результатов напрямую зависит от того, насколько тщательно и аккуратно данные готовились к анализу. Недостаточное внимание к этой деятельности может серьезно исказить статистические выводы, что, в свою очередь, ведет к неправильной интерпретации данных всего маркетингового исследования.
Обработкой данных может заниматься кто-то из интервьюеров. Самый внимательный из них. Для минимизации вероятности появления ошибок при вводе данных важно, чтобы данной работой занимался только один человек.
Анализ данных, по мнению Черчилля Г. А., как правило, включает несколько этапов (рисунок 2). Предварительный анализ начинается с преобразования собранных данных, редактирования, кодирования и табулирования. Преобразование – перенос данных с бумажных носителей в компьютерные базы данных.
Анализ данных
Кодирование
Табулирование
Редактирование Рисунок 2 – Процесс анализа данных Редактирование – это проверка и, если необходимо, корректировка каждой анкеты или формы наблюдений. На данном этапе формы и бланки должны быть проверены на предмет правильного и полного заполнения с соблюдением всех инструкций. Кодирование – это техническая процедура распределения данных по категориям. Табулирование – процедура подсчёта ответов, составляющих различные категории. На последнем этапе происходит сведение данных в табличный или другой вариант в результате подсчёта частоты тех или иных ответов на каждый из вопросов. Данные могут быть подвергнуты перекрёстной классификации (перекрёстному табулированию) по нескольким переменным.
Серьезное внимание требует процесс кодирования, которое состоит в присвоении каждому варианту ответа определенных кодов (категорий или классов). По этим кодам результаты опросов будут обрабатываться в дальнейшем с использованием компьютерных средств. Если анкета включает только структурированные вопросы или очень незначительное количество неструктурированных вопросов, она кодируется заранее. Это означает, что коды присваиваются, прежде чем начинается непосредственная полевая работа. Если же в анкете содержатся в основном неструктурированные вопросы, коды присваиваются уже после того, как заполненные анкеты возвращаются с места сбора данных (так называемое посткодирование).
Процесс кодирования осуществляют в три этапа:
устанавливаются категории кодирования (группы, подгруппы, классы, виды и т.д.), к которым будут относиться ответы;
назначаются кодовые номера категорий;
разрабатывается книга кодов.
На первом этапе разрабатывается система кодирования. Количество уровней кодирования будет зависеть от структуры вопросов в анкете.
По мнению Д.Н. Таганова существует три основных типа кодирования вопросов анкеты.
1. Закрытые вопросы, в которых респондент может указать только один вариант ответа (одновариантные), кодируются одной переменной (например, ql). Тип шкалы в данном случае может быть любым.
2. Закрытые вопросы, в которых респондент может дать несколько вариантов ответа (многовариантные), кодируются несколькими одновариантными переменными (например, q3_l, q3_2). Тип шкалы одновариантных переменных может быть только номинальным (дихотомическим).
3. Открытые вопросы, независимо от количества возможных вариантов ответа на них, кодируются одной переменной. Тип шкалы в данном случае может быть либо интервальным (для числовых данных, например q5_t), либо номинальным (для нечисловых данных, например q4_t).
Третий этап в технологии кодирования заключается в создании кодировочной таблицы или книга кодов. Книга кодов создается при достаточно большом количестве вопросов анкеты. В ней прописываются общие инструкции по применимости кодов, структура кодирования по категориям принятой классификации, как кодируется каждая позиция в системе вопросов.
Кодировочная книга применяется как руководство для кодировщика и помогает исследователю правильно определять и располагать переменные. Даже если анкета закодирована заранее, следует подготовить формальную кодировочную книгу. Кодировочная книга обычно включает: номер столбца, номер записи, номер переменной, название переменной, номер ответа, инструкции по кодированию.
Некоторыми учеными уже определено, какие именно методы анализа желательно использовать при определенной структуре исследования. Дисперсионный анализ подходит для работы с экспериментальными данными, полученными от проведения причинно-следственного исследования. Кроме того, очень весомы при выборе стратегии анализа данных результаты изучения собранных данных на этапе их подготовки к анализу.
Именно статистический анализ позволяет вскрыть такие закономерности и внутренние связи в данных, которые невозможно выявить другими средствами. Подтверждение гипотез о наличии связи между переменными, оценка характера данных связей, оценка влияния частных параметров продукта на общее впечатление от него потребителей, сегментирование потребителей, прогнозирование изменений рыночной конъюнктуры — это некоторые задачи, решаемые с применением статистических методов анализа. Д.Н. Таганов классифицировал методы анализа по трем типам проводимого анализа: 1) анализ различий, 2) ассоциативный анализ, 3) классификационный анализ (рисунок 3). Н.К. Малхотра разделяет статистические методы анализа на одномерные и многомерные (рисунок 4).
Описательный анализ (построение линейных распределений)
Логическая регрессия
Факторный анализ
Корреляционный анализ
Линейная регрессия
Перекрестные распределения
Т-тесты
Дисперсионный анализ
Анализ различий
Ассоциативный анализ
Дискриминантный анализ
Кластерный
анализ
Классификационный анализ
Рисунок 3. Статистический анализ данных Одномерные методы - методы применяемые для анализа данных в случаях:
если существует единый измеритель для оценки каждого элемента выборки,
если этих измерителей несколько, но каждая переменная анализируется отдельно от всех остальных.
Многомерные методы - методы анализа, применяемые для анализа данных, если для оценки каждого элемента выборки используется два или больше измерителя и эти переменные анализируются одновременно. Данные методы применяются для определения одновременных взаимосвязей между двумя или больше явлениями. Одномерные методы можно классифицировать на основе того, какие данные анализируются: метрические или неметрические данные. В свою очередь в зависимости от количества выборок эти методы делят на классы: 1) одна выборка; 2) две и больше выборок. При этом применяемые методы анализа могут также отличаться, в зависимости от того связаны ли выборки между собой или нет.
Статистические методы
Одномерные методы
Многомерные методы
Метрические данные
измеряются по интервальной шкале или относительной шкале.
1) Одна выборка:
t-критерий, Z-критерий
2) Две и больше выборок:
2.1. Независимые методы
Двухгрупповой t- критерий,
Z-критерий,
Однофакторный
дисперсионный анализ,
2.2. Взаимосвязанные методы Методы для зависимых переменных
Методы, применяемые в случаях, когда одна или больше переменных иден- тифицированы как зависимые, а остальные - как независимые.
Одна зависимая переменная более двух переменных ковариационный анализ регрессия
Двухгрупповой дискриминантный
анализ Несколько зависимых переменных дисперсионный и
ковариационный анализ корреляции
Множественный дискриминантный
анализ
Неметрические данные
оцениваются по номинальной или порядковой шкале.
1) Одна выборка:
Вариационный ряд
Критерий хи-квадрат
Критерий Колмогорова- Смирнова
Критерий серий
Биномиальный критерий
2) Две и больше выборок:
2.1. Независимые методы
Критерий хи-квадрат
Критерий Мэнна-Уитни
Медианы
Критерий Колмогорова-
Смирнова
Критерий Крускала-Уоллиса и ANOVA
2.2. Взаимосвязанные методы
Критерий знаков
Критерий Вилкоксона
Критерий МэкНемара
Критерий хи-квадрат
|