Индексы являются показателями сравнения как с прошлым периодом, так и с другой территорией, а также с некоторым нормативом или плановым заданием.
Каждый индекс включает отчетные и базисные данные.
Сравнение с отдаленной базой может быть проведено непосредственно с помощью базисного индекса, охватывающего весь период, или поэтапно ЁC с помощью цепных индексов.
Индексы подразделяются на сводные (общие) и обозначается как I, и индивидуальные ЁC обозначается i.
Часто можно слышать, что уровень потребительских цен понизился или повысился. Речь в этом случае идет об индексе цен на потребительские товары. Общее изменение образуется под влиянием изменений цен на отдельные товары. Таким образом, имеется ряд отношений: µ §,
где pij ЁC цены на товар j в период времени i.
Эти отношения не что иное, как индивидуальные индексы, и сводный индекс представляет собой средний из них:
µ §,
где j ЁC номер товара.
На практике, если говорить конкретно об измерении динамики цен на все продовольственные или непродовольственные товары, то ясно, что если, например, цены на ювелирные изделия из золота удвоятся, а цены на хлеб останутся неизменными, это не значит, что в целом цены выросли на 50% ((2+1)/2=1,5). Таким образом, индекс цен для каждого товара должен сопровождаться неким «весом», которые позволяет оценить относительную значимость этого индекса для потребителя. В качестве веса используют удельный вес в общей стоимости покупок в базисном периоде:
µ §,
где qoj ЁC объем потребления товара j.
Если обозначить удельный вес отдельных затрат doi, то получим общий индекс цен как средний арифметический взвешенный из индивидуальных индексов цен:
µ §
т.е. µ §
Каждый сводный индекс может быть представлен как средний из индивидуальных. В этом смысле, как и любая средняя, сводный индекс характеризует центральную тенденцию. Значение индекса среднего из индивидуальных зависит от изменений осредняемых индивидуальных индексов и от изменений признака-веса. Пример 2.5. Цены на товары A, B, C, D, E составили в базисном периоде 10, 15, 20, 25, 30 руб. соответственно, в отчетном периоде ЁC 11, 30, 28, 40, 27 руб. Доля товаров в базисной выручке ЁC 15, 26, 19, 25, 15 % соответственно. Рассчитать невзвешенный и взвешенный средний индекс цен.
Решение
Составим таблицу 2.1 для расчета индексов.
Невзвешенный средний индекс цен: µ §
Среднее значение веса: µ §
Взвешенный средний индекс цен: µ §
Таблица 2.1
Расчетные данные для примера 2.5
Товар
Цена, руб.Индекс ipДоля в базисной выручке doipdoPoPiA10111,10,150,165B15302,00,260,520C20281,40,190,266D25401,60,250,400E30270,90,150,135Итого1,001,486
Индексы считаются правильно построенными, если они удовлетворяют ряду тестов: обратимости во времени; обратимости по факторам; «кружному» испытанию; соизмеримости; пропорциональности; включения-исключения.
Индексы широко используются для анализа изменений средних взвешенных величин (средней, заработной платы, производительности труда, трудоемкости и т.д.).
Парная регрессия и корреляция в экономических исследованиях
Линейная регрессия и корреляция: смысл и оценка параметров
Большинство явлений и процессов в экономике находятся в постоянной взаимной связи. Исследование взаимозависимостей между объективно существующими явлениями играет большую роль в экономике. Оно дает возможность глубже понять сложный механизм причинно-следственных отношений между явлениями. Для исследования интенсивности, вида и формы зависимостей широко применяется корреляционно-регрессионный анализ, который является методическим инструментарием при решении задач прогнозирования, планирования и анализа хозяйственной деятельности предприятий.
Различают два типа связей между различными явлениями и их признаками: функциональную или жестко детерминированную и статистическую или стохастически детерминированную.
Функциональная связь двух величин возможна лишь при условии, что вторая из них зависит только от первой. В реальной природе, обществе, экономике такие связи крайне редки.
Если с изменением значения одной из переменных вторая может в определенных пределах принимать любые с некоторыми вероятностями, но ее среднее значение или иные статистические (массовые) характеристики изменяются по определенному закону, связь является статистической. То есть при статистической связи разным значениям одной переменной соответствуют разные распределения значений другой переменной.
Корреляционной связью называют важнейший частный случай статистической связи, состоящий в том, что разным значениям одной переменной соответствуют различные средние значения другой. С изменением значения признака X закономерным образом изменяется среднее значение признака Y, в то время как в каждом отдельном случае значение признака Y (с различными вероятностями) может принимать множество различных значений.
Если же с изменением значения признака Х среднее значение признака Y не изменяется закономерным образом, но закономерно изменяется другая статистическая характеристика (показатели вариации, асимметрии, эксцесса и т.п.), то связь является не корреляционной, а статистической.
Статистическая связь между двумя признаками (переменными величинами) предполагает, что каждый из них имеет случайную вариацию индивидуальных значений относительно средней величины. Если же такую вариацию имеет только один из признаков, а значения другого являются жестко детерминированными, то говорят лишь о регрессии (например, при анализе динамических рядов можно измерять регрессию уровней ряда урожайности в зависимости от различных лет). Таким образом, односторонняя вероятностная зависимость между случайными величинами есть регрессия.
Регрессия относительно числа переменных может быть простой (регрессия между двумя переменными) и множественной (регрессия между зависимой переменной Y и несколькими объясняющими переменными (x1, x2, ЎK xm)).
Относительно формы зависимости регрессия бывает линейной (выражается линейной функцией) и нелинейной (выражается нелинейной функцией).
При использовании на практике корреляционно-регрессионного метода необходимо выполнение следующих условий:
наличие данных по достаточно большой совокупности, число которых зависит от цели анализа, требуемой точности и надежности параметров связи, от числа факторов, корреляция с которыми изучается. Обычно считается, что число наблюдений должно быть в 5-10 раз больше числа факторов;
надежное выражение закономерности в средней величине;
необходимость подчинения распределения совокупности по результативному и факторным признакам нормальному закону распределения вероятностей.
В соответствии с сущностью корреляционной связи ее изучение ставит следующие основные задачи:
измерение параметров уравнения, выражающего связь средних значений зависимой переменной со значениями независимой переменной ЁC одной или нескольких (зависимость средних величин результативного признака от значений одного или нескольких факторных признаков);
измерение тесноты связи двух (или большего числа признаков между собой).
Первая задача решается оценкой параметров уравнения регрессии. Вторая - расчетом коэффициентов корреляции.
Поясним на графике (рис. 2.1, а и б) различия между корреляцией и регрессией.
Угол наклона линии регрессии относительно оси абсцисс один и тот же на рисунках а и б. Однако, на рисунке а точки корреляционного поля концентрируются около линии регрессии, тогда как на рисунке б точки поля корреляции разбросаны. Очевидно, что теснота связи, то есть мера корреляции между х и у, в случае а будет высокой, а в случае б ЁC низкой. Следовательно, уравнение регрессии в случае а будет статистически значимо, а в случае б оно может быть статистически незначимо. Таким образом, случаи а и б различаются величиной коэффициентов корреляции, но в то же время будут иметь одинаковые коэффициенты регрессии:
(а) ryx Ѓ‚ (б) ryx;
(а) byx = (б) byx.
Рис. 2.1. Регрессия при разной интенсивности корреляции:
а ЁC тесная корреляция; б ЁC слабая корреляция
Вторая задача специфична для статистических связей, а первая разработана для функциональных связей и является общей. Основным методом решения задачи нахождения параметров уравнения связи является метод наименьших квадратов (МНК), разработанный К. Ф. Гауссом (1777ЎЄ1855). Он состоит в минимизации суммы квадратов отклонений фактически измеренных значений зависимой переменной у от ее значений, вычисленных по уравнению связи с факторным признаком, одним или несколькими, х.
Для измерения тесноты связи применяется ряд показателей. При парной связи теснота связи измеряется прежде всего корреляционным отношением, которое обозначается греческой буквой з. Квадрат корреляционного отношения ЁC это отношений межгрупповой дисперсии результативного признака, которая выражает влияние различий группировочного факторного признака на среднюю величину результативного признака, к общей дисперсии результативного признака, выражающей влияние на него всех причин и условий. Квадрат корреляционного отношения называется коэффициентом детерминации:
µ §,
где k ЁC число групп по факторному признаку;
µ § ЁC общее среднее значение;
fj ЁC частота в j-й группе;
n ЁC число единиц в совокупности;
yi ЁC значение результативного признака для i-й единицы;
µ § ЁC среднее значение y в j-ой группе. Простейшей системой корреляционной связи является линейная связь между двумя ЁC парная линейная корреляция.
Практическое ее значение в том, что есть системы, в которых среди всех факторов, влияющих на результативный признак, выделяется один важнейший фактор, который в основном определяет вариацию результативного признака. Измерение парных корреляций составляет необходимый этап в изучении сложных многофакторных связей.
Уравнение парной линейной корреляционной связи называется уравнением парной регрессии и имеет вид:
у = а + bх,
где y ЁC среднее значение результативного признака у при определенном значении факторного признака х;
а ЁC свободный член уравнения;
b ЁC коэффициент регрессии, измеряющий среднее отношение отклонения результативного признака от его средней величины к отклонению факторного признака от его средней величины на одну единицу его измерения, - вариация у, приходящаяся на единицу вариации х. Параметры уравнения рассчитываются методом наименьших квадратов (МНК) по данным о значениях признаков x и y в изучаемой совокупности, состоящей из n единиц.
Исходное условие МНК для прямой линии имеет вид:
µ §.
Для отыскания значений параметров а и b, при которых f (a,b) принимает минимальное значение, частные производные функции приравниваем к нулю и преобразуем полученные уравнения, которые называются нормальными уравнениями МНК для прямой:
µ §,
µ §.
Отсюда система нормальных уравнений имеет вид:
µ §, µ §. Путем преобразований получаем: µ §, µ §. Коэффициент парной линейной регрессии, обозначенный b, имеет смысл показателя силы связи между вариацией факторного признака х и вариацией результативного признака у. Он измеряет среднее по совокупности отклонение y от его средней величины при отклонении признака х от своей средней величины на принятую единицу измерения.
Теснота парной линейной корреляционной связи, как и любой другой формы связи, может быть измерена корреляционным отношением з. Кроме того, при линейной форме уравнения применяется другой показатель тесноты связи ЁC коэффициент корреляции ryx. Этот показатель представляет собой стандартизованный коэффициент регрессии, то есть коэффициент, выраженный не в абсолютных единицах измерения признаков, а в долях среднего квадратического отклонения результативного признака:
µ §, µ §, µ §.
Коэффициент корреляции может принимать значения -1ЎЬ r ЎЬ1; по абсолютной величине 0 ЎЬ |r| ЎЬ 1. Отрицательные значения ryx свидетельствуют об обратной связи признаков у и x, положительные ЁC о прямой связи.
Обычно считают связь сильной, если r > 0,7; средней ЁC при 0,5 < r < 0,7; слабой ЁC при r < 0,5. Максимально тесная связь ЁC это связь функциональная: rxy_max = 1. Пример 2.6. Рассмотрим анализ корреляционной парной линейной связи по данным 16 сельскохозяйственных предприятий о затратах на 1 корову и надое молока на 1 корову (таблица 2.2).
Средние значения признаков: µ § руб.\голов, µ § ц/голов.
Сопоставляя знаки отклонений признаков x и y от средних величин, видим явное преобладание совпадающих по знакам пар отклонений: их 14, и только 2 пары, несовпадающих знаков.
Немецкий психиатр Г. Т. Фехнер предложил меру тесноты связи в виде отношения разности числа совпадающих и несовпадающих знаков пар отклонений к сумме этих чисел:
КФехнера = (С ЁC Н)/(С + Н) = (14 ЁC 2)/ (14 + 2) = 0,75
Коэффициент Фехнера ЁC очень грубый показатель тесноты связи, не учитывающий величину отклонений признаков от средних значений, но он может служить некоторым ориентиром в оценке интенсивности связи. В данном случае значение коэффициента указывает на тесную связь признаков.
Вычислим на основе итоговой строки табл. 2.2 параметр уравнения парной линейной корреляции ЁC коэффициент регрессии:
b = 28473,7 /818533 = 0,0347
Он означает, что в среднем по изучаемой совокупности отклонение затрат на 1 корову от средней величины на 1 руб. приводило к отклонению с тем же знаком среднего надоя молока на 0,0347 ц, т.е. на 3,47 кг на корову.
Таблица 2.2
Корреляция между затратами на 1 корову и надоем молока в среднем от 1 коровы
Номер единиц совокупностиЗатраты на одну корову, руб./голов, xiНадой от одной коровы, ц, yiµ §µ §µ §(µ §µ §µ §Расчетные значения надоя, ц., yi1160234,2-3-1,0+3,091,0035,12119919,6-406-15,6+6333,6164836243,3621,13132127,3-283-7,9+2235,78008962,4125,34167832,5+73-2,7-197,153297,2937,75160033,2-5-2,0+10,0254,0035,06135531,8-250-3,4+850,06250011,5626,57141330,7-192-4,5+864,03686420,2528,58149032,6-115-2,6+299,0132256,7631,29161626,7+11-8,5-93,512172,2535,610169342,4+88+7,2+633,6774451,8438,211166537,9+60+2,7+162,036007,2937,312166636,6+61+1,4+85,437211,9637,313162838,0+23+2,8+64,45297,8436,014160432,7-1-2,5+2,516,2535,215207751,7+472+16,5+7788,0222784272,2551,616207155,3+466+20,1+9366,6217156404,0151,4µ §563,2--+28473,78185331180,32563,0Источник: Елисеева И.И., Юзбашев М.М. Общая теория статистики. Свободный член уравнения регрессии: а = 35,2 - 0,0347 * 1605 = -20,49
Уравнение регрессии в целом имеет вид: µ §= 0,0347x - 20,49 (рис. 2.2).
Отрицательная величина свободного члена уравнения означает, что область существования признака у не включает нулевого значения признака х и близких к нулю значений. Можно рассчитать минимально возможную величину фактора x, при котором обеспечивается наименьшее значение признака y.
Xmin = a:b = 20,49:0,0347 = 590,5 руб./головы
- это наименьшая сумма затрат на 1 корову, при которых корова способна давать молоко. Если же область существования результативного признака включает нулевое значение признака-фактора, то свободный член является положительным и означает среднее значение результативного признака при отсутствии данного фактора, например, среднюю урожайность картофеля при отсутствии органических удобрений.
Коэффициент корреляции равен:
µ §
Полученное в примере значение 0,916 свидетельствует об очень тесной связи надоев молока с затратами в расчете на 1 корову.
Полученное значение гораздо больше коэффициента Фехнера. Квадрат коэффициента корреляции, т.е. коэффициент детерминации, составил 0,839, или 83,9%. Отсюда можно сделать вывод о том, что вариация надоев молока на 1 корову связана с вариацией затрат в хозяйствах, произведенных в среднем на 1 корову.
|