Скачать 489.21 Kb.
|
Спецификация модели Все предыдущие рассуждения и выводы, касающиеся классической множественной регрессии, основывались на предположении, что мы имеем дело с правильной спецификацией модели. При этом под спецификацией модели понимается выбор объясняющих переменных. В этой связи важное значение приобретает рассмотрение двух вопросов, имеющих смысл именно во множественной регрессии, когда исследователь имеет дело с несколькими факторами: возможная мультиколлинеарность факторов и частная корреляция. Последняя особенно тесно связана с процедурами пошагового отбора переменных. Включение в уравнение множественной регрессии того или иного набора факторов связано прежде всего с представлением исследователя о природе взаимосвязи моделируемого показателя с другими экономическими явлениями. Факторы, включаемые во множественную регрессию, должны отвечать следующим требованиям:
Включение в модель факторов с высокой взаимной корреляцией, когда, например, , для зависимости может привести к нежелательным последствиям – система нормальных уравнений может оказаться плохо обусловленной и повлечь за собой неустойчивость и ненадежность оценок коэффициентов регрессии. Если между факторами существует высокая корреляция, то нельзя определить их изолированное влияние на результативный показатель и параметры уравнения регрессии оказываются неинтерпретируемыми. Так, в приведенной зависимости с двумя факторами предполагается, что факторы х1 и х2 независимы друг от друга, т.е. . Тогда можно говорить, что параметр b1 измеряет силу влияния фактора х1 на результат у при неизменном значении фактора х2. Если же , то с изменением фактора х1 фактор х2 не может оставаться неизменным. Отсюда b1 и b2 нельзя интерпретировать как показатель раздельного влияния х1 и х2 на у. Как было сказано ранее, добавление нового фактора в регрессии приводит к возрастанию коэффициента детерминации и уменьшению остаточной дисперсии. Однако эти изменения могут быть незначительны, и не каждый фактор целесообразно вводить в модель. Таким образом, хотя теоретически регрессионная модель позволяет учесть любое число факторов, практически в этом нет необходимости. Отбор факторов производится на основе качественного теоретико – экономического анализа. Однако теоретический анализ часто не позволяет однозначно ответить на вопрос о количественной взаимосвязи рассматриваемых признаков и целесообразности включения фактора в модель. Поэтому отбор факторов обычно осуществляется в две стадии: на первой подбираются факторы, исходя из сущности проблемы; на второй – анализируется матрица показателей корреляции и устанавливается, какие из факторов наиболее тесно связаны с результатом, а какие – между собой. Здесь эконометрист чаще всего сталкивается с проблемой мультиколлинеарности. Под полной мультиколлинеарностью понимается существование между некоторыми из факторов линейной функциональной связи. Количественным выражением этого служит равенство нулю определителя матрицы независимых переменных Х, т.е. эта матрица является вырожденной, а её ранг – меньше, чем (р+1). Тогда вырожденной будет и матрица (Х’Х), у которой не будет существовать обратной матрицы. В практике статистических исследований полная мультиколлинеарность встречается достаточно редко, т.к. её несложно избежать уже на предварительной стадии анализа и отбора множества объясняющих переменных. Реальная (или частичная) мультиколлинеарность возникает в случаях существования достаточно тесных линейных статистических связей между объясняющими переменными. Точных количественных критериев для определения наличия или отсутствия реальной мультиколлинеарности не существует. Тем не менее, существуют некоторые эвристические рекомендации по выявлению мультиколлинеарности. В первую очередь анализируют матрицу парных коэффициентов корреляции: (38) точнее, ту её часть, которая относится к объясняющим переменным. Считается, что две переменные явно коллинеарны, если . В этом случае факторы дублируют друг друга, и один из них рекомендуется исключить из регрессии. Предпочтение при этом отдаётся фактору, который при достаточно тесной связи с результатом имеет наименьшую тесноту связи с другими факторами. Пусть, например, при изучении зависимости матрица парных коэффициентов корреляции оказалась следующей: Очевидно, что факторы х1 и х2 дублируют друг друга (). Однако в модель следует включить фактор х2, а не х1, поскольку корреляция фактора х2 с у достаточно высокая (), а с фактором х3 слабая (). Другим методом оценки мультиколлинеарности факторов может служить определитель матрицы парных коэффициентов корреляции между факторами (37). Обоснованием данного подхода служат такие рассуждения. Если бы факторы не коррелировали между собой, то в определителе (37) все внедиагональные элементы равнялись бы нулю, а на диагонали стояли бы единицы. Такой определитель равен единице. Если же, наоборот, между факторами существует полная линейная зависимость и все коэффициенты межфакторной корреляции равны единице, то определитель такой матрицы равен нулю. Следовательно, чем ближе к нулю определитель (37), тем сильнее мультиколлинеарность факторов и ненадежнее результаты множественной регрессии. И наоборот, чем ближе к единице величина (37), тем меньше мультиколлинеарность факторов. Для оценки значимости мультиколлинеарности факторов выдвигается гипотеза Н0:Δr11=1. Доказано, что величина имеет приближенное распределение χ2 с степенями свободы. Если , то гипотеза Н0 отклоняется, мультиколлинеарность считается доказанной. Другим методом выявления мультиколлинеарности является анализ коэффициентов множественной детерминации факторов. Для этого в качестве зависимой переменной рассматривается каждый из факторов. Например, коэффициент рассчитывается по следующей регрессии: где первый фактор взят в качестве результативного признака, а остальные факторы – как независимые переменные, влияющие на первый фактор. Чем ближе такой R2 к единице, тем сильнее проявляется мультиколлинеарность факторов. Оставляя в уравнении регрессии факторы с минимальной R2, можно решить проблему отбора факторов. При этом рассчитывается статистика: (39) если коэффициент статистически значим, то . В этом случае xj является линейной комбинацией других факторов, и его можно исключить из регрессии. Перечислим основные последствия мультиколлинеарности:
Единого подхода к устранению мультиколлинеарности не существует. Существует ряд методов, которые не являются универсальными и применимы в конкретных ситуациях. Простейшим методом устранения мультиколлинеарности является исключение из модели одной или нескольких коррелированных переменных. Здесь необходима осторожность, чтобы не отбросить переменную, которая необходима в модели по своей экономической сущности, но зачастую коррелирует с другими переменными (например, цена блага и цены заменителей данного блага). Иногда для устранения мультиколлинеарности достаточно увеличить объем выборки. Например, при использовании ежегодных данных можно перейти к поквартальным данным. Это приведёт к сокращению дисперсии коэффициентов регрессии и увеличению их статистической значимости. Однако при этом можно усилить автокорреляцию, что ограничивает возможности такого подхода. В некоторых случаях изменение спецификации модели, например, добавление существенного фактора, решает проблему мультиколлинеарности. При этом уменьшается остаточная СКО, что приводит к уменьшению стандартных ошибок коэффициентов. В ряде случаев минимизировать либо вообще устранить проблему мультиколлинеарности можно с помощью преобразования переменных. Например, пусть эмпирическое уравнение регрессии имеет вид: где факторы коррелированы. Здесь можно попытаться определить отдельные регрессии для относительных величин: (40) Возможно, что в моделях, аналогичных (40), проблема мультиколлинеарности будет отсутствовать. Теперь рассмотрим другой вопрос, имеющий важное значение для проблем, связанных со спецификацией модели множественной регрессии. Это частная корреляция. С помощью частных коэффициентов корреляции проводится ранжирование факторов по степени их влияния на результат. Кроме того, частные показатели корреляции широко используются при решении проблем отбора факторов: целесообразность включения того или иного фактора в модель доказывается величиной показателя частной корреляции. Частные коэффициенты корреляции характеризуют тесноту связи между результатом и соответствующим фактором при устранении влияния других факторов, включенных в уравнение регрессии. Показатели частной корреляции представляют собой отношение сокращения остаточной дисперсии за счет дополнительного включения в модель нового фактора к остаточной дисперсии, имевшей место до введения его в модель. Высокое значение коэффициента парной корреляции между исследуемой зависимой и какой – либо независимой переменной может означать высокую степень взаимосвязи, но может быть обусловлено и другой причиной, например, третьей переменной, которая оказывает сильное влияние на две первые, что и объясняет их высокую коррелированность. Поэтому возникает задача найти «чистую» корреляцию между двумя переменными, исключив (линейное) влияние других факторов. Это можно сделать с помощью коэффициента частной корреляции. Коэффициенты частной корреляции определяются различными способами. Рассмотрим некоторые из них. Для простоты предположим, что имеется двухфакторная регрессионная модель: (41) и имеется набор наблюдений . Тогда коэффициент частной корреляции между у и, например, х1 после исключения влияния х2 определяется по следующему алгоритму:
(42) Значения частных коэффициентов корреляции лежат в интервале [-1,1], как у обычных коэффициентов корреляции. Равенство нулю означает отсутствие линейного влияния переменной х1 на у. Существует тесная связь между коэффициентом частной корреляции и коэффициентом детерминации R2: (43) где - обычный коэффициент корреляции. Описанная выше процедура обобщается на случай, когда исключается влияние нескольких переменных. Для этого достаточно переменную х2 заменить на набор переменных Х2, сохраняя определение (42) (при этом можно в число исключаемых переменных вводить и у, определяя частную корреляцию между факторами). Другой способ определения коэффициентов частной корреляции – матричный. Обозначив для удобства зависимую переменную как х0, запишем определитель матрицы парных коэффициентов корреляции в виде: (44) Тогда частный коэффициент корреляции определяется по формуле: , (45) где Rii - алгебраическое дополнение для элемента rii в определителе (44). Существует ещё один способ расчета – по рекуррентной формуле. Порядок частного коэффициента корреляции определяется количеством факторов, влияние которых исключается. Например, - коэффициент частной корреляции первого порядка. Соответственно коэффициенты парной корреляции называются коэффициентами нулевого порядка. Коэффициенты более высоких порядков можно определить через коэффициенты более низких порядков по рекуррентной формуле: (46) Если исследователь имеет дело лишь с тремя – четырьмя переменными, то удобно пользоваться соотношениями (46). При больших размерностях задачи удобнее расчет через определители, т.е. по формуле (45). В соответствии со смыслом коэффициентов частной корреляции можно записать формулу: (47) При исследовании статистических свойств выборочного частного коэффициента корреляции порядка k следует воспользоваться тем, что он распределен точно так же, как и обычный парный коэффициент корреляции с единственной поправкой: объём выборки надо уменьшить на k единиц, т.е. полагать его равным n-k, а не n. |
Показатели рейтинга по курсу «Философия» для студентов 2 курса всех специальностей Три модуля Данная программа разработана для студентов 1-5 курсов дневного отделения по специальности 022300 в соответствии с Государственным... | Конспект лекций для студентов всех формы обучения специальностей... Внешнеэкономическая деятельность. Конспект лекций для студентов всех формы обучения специальностей 080502(0-9) – экономика и управление... | ||
Методическое пособие для студентов дневного отделения всех специальностей... Малеева Мария Ахмедовна, к ф н., доцент Карданова Нэли Александровна, ст преподаватель | Конспект лекций для студентов всех форм обучения и всех специальностей... Министерство образования российской федерации таганрогский государственный радиотехнический | ||
Методическое пособие для студентов четвертого курса дневного и заочного... Вопросы к зачету, задачи и практические задания, список источников и литературы для студентов четвертого курса дневного и заочного... | Рабочая программа по курсу «криминалистика» Специальность 02. 11. 00 юриспруденция Учебная дисциплина «Криминалистика» изучается студентами 3 и 4 курса дневного отделения, 5 и 6 курса заочного отделения, третьего... | ||
Планы семинарских занятий по курсу «Отечественная история» («История»,... Примерные планы семинарских занятий составлены в соответствии с рабочей программой учебной дисциплины «История» для студентов I курса... | Курс лекций "концепции современного естествознания " для студентов факультета социологии Рф и предназначен для студентов 2 курса дневного отделения Факультета социологии Санкт-Петербургского государственного университета... | ||
1. Химический состав живых организмов Учебно-методический комплекс предназначен для студентов III курса факультета естественных наук, направление подготовки 06. 03. 01... | 1. Химический состав живых организмов Учебно-методический комплекс предназначен для студентов III курса факультета естественных наук, направление подготовки 020400 "Биология"... | ||
Методические указания по курсу «Информатика» (материалы тестирования... Охватывают все разделы курса | Учебно-методический комплекс для студентов специальной медицинской... Учебно-методический комплекс предназначен для студентов, аспирантов, преподавателей учреждений системы высшего профессионального... | ||
Технологический институт в г. Таганроге Внешнеэкономическая деятельность. Конспект лекций для студентов всех формы обучения специальностей 080502(0-9) – экономика и управление... | 1. Химический состав живых организмов Учебно-методический комплекс предназначен для студентов III курса факультета естественных наук, направление подготовки 020201 "Биология"... | ||
Федеральное государственное бюджетное образовательное учреждение Внешнеэкономическая деятельность. Конспект лекций для студентов всех формы обучения специальностей 080502(0-9) – экономика и управление... | Федеральное государственное бюджетное образовательное учреждение Внешнеэкономическая деятельность. Конспект лекций для студентов всех формы обучения специальностей 080502(0-9) – экономика и управление... |