Скачать 489.21 Kb.
|
Пример. По итогам года 37 однородных предприятий легкой промышленности были зарегистрированы следующие показатели их работы: у – среднемесячная характеристика качества ткани (в баллах), х1 – среднемесячное количество профилактических наладок автоматической линии; х2 – среднемесячное количество обрывов нити. По исходным данным были подсчитаны выборочные парные коэффициенты корреляции: Проверка статистической значимости этих величин показала отсутствие значимой статистической связи между результативным признаком и каждым из факторов, что не согласуется с профессиональными представлениями технолога. Однако расчет частных коэффициентов корреляции дал значения: которые вполне соответствуют нашим представлениям о естественном характере связей между изучаемыми показателями. Теперь остановимся на специальных процедурах спецификации модели множественной регрессии, которые обычно называются процедурами пошагового отбора переменных. Иногда исследователь заранее знает характер зависимости исследуемых величин, опираясь на экономическую теорию, предыдущие результаты или априорные знания, и его задача состоит лишь в оценивании неизвестных параметров. Классическим примером является оценивание параметров производственной функции Кобба – Дугласа, где заранее известно, что в качестве факторов выступают капиталовложения и трудозатраты. Однако на практике чаще имеется большое число наблюдений различных независимых переменных, но нет априорной модели изучаемого явления. Возникает проблема, какие переменные включать в регрессионную схему. В компьютерные пакеты включены различные эвристрические процедуры пошагового отбора факторов. Основными пошаговыми процедурами являются:
Рассмотрим вкратце одну из широко применяемых процедур, которая относится к процедурам последовательного присоединения. Это процедура «всех возможных регрессий». Для заданного значения k (k=1,2,…,p-1) путем полного перебора всех возможных комбинаций из k объясняющих переменных, отобранных из исходного набора факторов , определяются такие переменные , для которых коэффициент детерминации с результатом был бы максимальным. Таким образом, на первом шаге процедуры (k=1) находят одну объясняющую переменную, которую можно назвать наиболее информативным фактором при условии, что в регрессионную модель допускается включить только одну переменную из первоначального набора. На втором шаге определяется уже наиболее информативная пара переменных из исходного набора, и эта пара будет иметь наиболее тесную статистическую связь с результатом. Вообще говоря, в состав этой пары может не войти переменная, объявленная наиболее информативной среди всех моделей с одной переменной. На третьем шаге (k=3) будет отобрана наиболее информативная тройка факторов, на четвертом (k=4) – наиболее информативная четверка объясняющих переменных и т.д. В качестве критерия останова этой процедуры, т.е. выбора оптимального числа k0 факторов, которые следует включить в модель, предлагается следующее. На каждом шаге вычисляется нижняя доверительная граница коэффициента детерминации (48) где - скорректированный коэффициент детерминации для k наиболее информативных факторов, - обычный коэффициент детерминации. В соответствии с критерием останова следует выбирать k0, при котором величина (48) достигает своего максимума. Следует признать, что пошаговые процедуры, вообще говоря, не гарантируют получения оптимального (в смысле критерия максимума коэффициента детерминации) набора факторов. Однако в подавляющем большинстве ситуаций получаемые с помощью пошаговой процедуры наборы переменных оказываются оптимальными или близкими к оптимальным. Гетероскедастичность Одной из ключевых предпосылок МНК является условие постоянства дисперсий случайных отклонений для любых наблюдений. Выполнимость данной предпосылки называется гомоскедастичностью; невыполнимость данной предпосылки называется гетероскедастичностью. В качестве примера реальной гетероскедастичности можно сказать, что люди с большим доходом не только тратят в среднем больше, чем люди с меньшим доходом, но и разброс в их потреблении также больше, поскольку они имеют больше простора для распределения дохода. При гетероскедастичности последствия применения МНК будут следующими:
В ряде случаев, зная характер исходных данных, можно предвидеть гетероскедастичность и попытаться устранить её ещё на стадии спецификации. Однако значительно чаще эту проблему приходится решать после построения уравнения регрессии. Графическое построение отклонений от эмпирического уравнения регрессии позволяет визуально определить наличие гетероскедастичности. В этом случае по оси абсцисс откладываются значения объясняющей переменной xi (для парной регрессии) либо линейную комбинацию объясняющих переменных: (для множественной регрессии), а по оси ординат либо отклонения ei, либо их квадраты . Если все отклонения находятся внутри горизонтальной полосы постоянной ширины, это говорит о независимости дисперсий от значений объясняющей переменной и выполнимости условия гомоскедастичности. В других случаях наблюдаются систематические изменения в соотношениях между значениями и квадратами отклонений : Такие ситуации отражают большую вероятность наличия гетероскедастичности для рассматриваемых статистических данных. В настоящее время для определения гетероскедастичности разработаны специальные тесты и критерии для них. Тест ранговой корреляции Спирмена. При использовании данного теста предполагается, что дисперсия отклонений будет либо увеличиваться, либо уменьшаться с увеличением значений х. Поэтому для регрессии, построенной по МНК, абсолютные величины отклонений |ei| и значения xi будут коррелированы. Затем определяется коэффициент ранговой корреляции: , ( ) где di - разность между рангами xi и |ei|, n – число наблюдений. Например, если х20 является 25 – м по величине среди всех значений х, а e20 является 32 – м, то d20 = 25 – 32 = -7. Доказано, что при справедливости нуль – гипотезы статистика ( ) имеет распределение Стьюдента с числом степеней свободы (n-2). Поэтому, если наблюдаемое значение статистики ( ) превышает критическое , вычисленное по таблице критических точек распределения Стьюдента (двусторонних), то гипотезу о равенстве нулю коэффициента корреляции ( ) следует отклонить и признать наличие гетероскедастичности. В противном случае нуль – гипотеза, которая соответствует отсутствию гетероскедастичности, принимается. В модели множественной регрессии проверка нуль – гипотезы может осуществляться с помощью t – статистики по каждому фактору отдельно. Тест Голдфелда – Квандта. В данном случае предполагается, что стандартное отклонение пропорционально значению переменной xj, т.е. . Предполагается, что остатки имеют нормальное распределение и отсутствует автокорреляция остатков. Тест состоит в следующем:
будет существенно меньше остаточной СКО по третьей регрессии
которая предполагает отсутствие гетероскедастичности. Для проверки нуль – гипотезы строится следующая статистика ( ) которая при справедливости нуль – гипотезы имеет распределение Фишера с (k-p-1, k-p-1) степенями свободы.
, то гипотеза об отсутствии гетероскедастичности отклоняется на уровне значимости α. По рекомендациям специалистов, объем исключаемых данных k должен быть примерно равен четверти общего объёма выборки n. Этот же тест может быть использован и при предположении об обратной пропорциональности между дисперсией и значениями объясняющей переменной. В этом случае статистика Фишера принимает вид: ( ) При установлении гетероскедастичности возникает необходимость преобразования модели с целью устранения данного недостатка. Вид преобразования зависит от того, известны или нет дисперсии отклонений . В случае, если дисперсии отклонений известны для каждого наблюдения, применяется метод взвешенных наименьших квадратов (ВНК). Гетероскедастичность устраняется, если разделить каждое наблюдаемое значение на соответствующее ему значение дисперсии. Рассмотрим для простоты ВНК на примере парной регрессии: ( ) Разделим обе части ( ) на известное : ( ) Сделаем замены переменных: ( ) получим уравнение регрессии без свободного члена, но с двумя факторами и с преобразованным отклонением: ( ) Можно показать, что для vi выполняется условие гомоскедастичности. Поэтому для модели ( ) выполняются все предпосылки МНК, и оценки, полученные по МНК, будут наилучшими линейными несмещенными оценками. Таким образом, наблюдения с наименьшими дисперсиями получают наибольшие «веса», а наблюдения с наибольшими дисперсиями – наименьшие «веса». Поэтому наблюдения с меньшими дисперсиями отклонений будут более значимыми при оценке параметров регрессии, чем наблюдения с большими дисперсиями. При этом повышается вероятность получения более точных оценок. Полученные по МНК оценки параметров модели ( ) можно использовать в первоначальной модели ( ). Для применения ВНК необходимо знать фактические значения дисперсий отклонений . На практике такие значения известны крайне редко. Поэтому, чтобы применить ВНК, необходимо сделать реалистические предположения о значениях . Чаще всего предполагается, что дисперсии отклонений пропорциональны или значениям xi, или значениям . Если предположить, что дисперсии пропорциональны значениям фактора xj, т.е. ( ) тогда уравнение () преобразуется делением его левой и правой частей на : или ( ) Здесь для случайных отклонений выполняется условие гомоскедастичности. Следовательно, для регрессии ( ) применим обычный МНК. Следует отметить, что регрессия ( ) не имеет свободного члена, но зависит от двух факторов. Оценив для ( ) по МНК коэффициенты а и b, возвращаемся к исходному уравнению регрессии. Если в уравнении регрессии присутствует несколько объясняющих переменных, вместо конкретной переменной xj используется исходное уравнение множественной регрессии т.е. фактически линейная комбинация факторов. В этом случае получают следующую регрессию: ( ) Если предположить, что дисперсии пропорциональны , то соответствующим преобразованием будет деление уравнения регрессии ( ) на xi: или, если переобозначить остатки как : ( ) Здесь для отклонений vi также выполняется условие гомоскедастичности. Применяя обычный МНК к регрессии ( ) в преобразованных переменных , получим оценки параметров, после чего возвращаемся к исходному уравнению ( ). Отметим, что в регрессии ( ) по сравнению с исходным уравнением параметры поменялись ролями: свободный член а стал коэффициентом, а коэффициент b – свободным членом. |
Показатели рейтинга по курсу «Философия» для студентов 2 курса всех специальностей Три модуля Данная программа разработана для студентов 1-5 курсов дневного отделения по специальности 022300 в соответствии с Государственным... | Конспект лекций для студентов всех формы обучения специальностей... Внешнеэкономическая деятельность. Конспект лекций для студентов всех формы обучения специальностей 080502(0-9) – экономика и управление... | ||
Методическое пособие для студентов дневного отделения всех специальностей... Малеева Мария Ахмедовна, к ф н., доцент Карданова Нэли Александровна, ст преподаватель | Конспект лекций для студентов всех форм обучения и всех специальностей... Министерство образования российской федерации таганрогский государственный радиотехнический | ||
Методическое пособие для студентов четвертого курса дневного и заочного... Вопросы к зачету, задачи и практические задания, список источников и литературы для студентов четвертого курса дневного и заочного... | Рабочая программа по курсу «криминалистика» Специальность 02. 11. 00 юриспруденция Учебная дисциплина «Криминалистика» изучается студентами 3 и 4 курса дневного отделения, 5 и 6 курса заочного отделения, третьего... | ||
Планы семинарских занятий по курсу «Отечественная история» («История»,... Примерные планы семинарских занятий составлены в соответствии с рабочей программой учебной дисциплины «История» для студентов I курса... | Курс лекций "концепции современного естествознания " для студентов факультета социологии Рф и предназначен для студентов 2 курса дневного отделения Факультета социологии Санкт-Петербургского государственного университета... | ||
1. Химический состав живых организмов Учебно-методический комплекс предназначен для студентов III курса факультета естественных наук, направление подготовки 06. 03. 01... | 1. Химический состав живых организмов Учебно-методический комплекс предназначен для студентов III курса факультета естественных наук, направление подготовки 020400 "Биология"... | ||
Методические указания по курсу «Информатика» (материалы тестирования... Охватывают все разделы курса | Учебно-методический комплекс для студентов специальной медицинской... Учебно-методический комплекс предназначен для студентов, аспирантов, преподавателей учреждений системы высшего профессионального... | ||
Технологический институт в г. Таганроге Внешнеэкономическая деятельность. Конспект лекций для студентов всех формы обучения специальностей 080502(0-9) – экономика и управление... | 1. Химический состав живых организмов Учебно-методический комплекс предназначен для студентов III курса факультета естественных наук, направление подготовки 020201 "Биология"... | ||
Федеральное государственное бюджетное образовательное учреждение Внешнеэкономическая деятельность. Конспект лекций для студентов всех формы обучения специальностей 080502(0-9) – экономика и управление... | Федеральное государственное бюджетное образовательное учреждение Внешнеэкономическая деятельность. Конспект лекций для студентов всех формы обучения специальностей 080502(0-9) – экономика и управление... |