Числовые характеристики случайных величин
При решении многих практических задач часто достаточно указать отдельные числовые характеристики, определяющие особенности того или иного распределения случайной величины. Это прежде всего среднее значение, которое принадлежит к характеристикам положения случайной величины, т. е. представляет такую величину, относительно которой каким-то образом группируются, рассеиваются всевозможные значения случайной величины.
Среднее значение, или математическое ожидание дискретной случайной величины, вычисляется по формуле
µ §,
где хi ЁC возможные значения случайной величины X;
Pi - вероятность появления i-го возможного значения случайной величины X.
Математическое ожидание характеризует среднее значение случайной величины.
Для непрерывной случайной величины X математическое ожидание определяется интегралом:
µ §.
Медианой Me (Х) случайной величины называется такая величина, относительно которой равновероятно получение большего или меньшего значения случайной величины:
Р(Х > Me) = Р(Х < Me).
Медиану применяют в качестве характеристики ряда распределения в тех случаях, когда имеются очень большие колебания случайной величины.
Модой Мо (Х) дискретной случайной величины называется ее значение, обладающее наибольшей вероятностью. Для непрерывной случайной величины мода есть такое значение, которое отвечает максимальной плотности распределения.
Для оценки степени разброса, рассеивания значений случайной величины относительно среднего вычисляют следующие характеристики: дисперсию; среднее квадратическое отклонение; коэффициент вариации.
Дисперсией называется математическое ожидание квадрата отклонений случайной величины от своего математического ожидания:
µ §
Чем больше дисперсия, тем в среднем больше отклонение значений случайной величины относительно математического ожидания, т. е. будет больше рассеивание случайной величины.
Дисперсия дискретной случайной величины вычисляется по формуле:
µ §.
Дисперсия непрерывной случайной величины равна:
µ §.
Среднее квадратическое отклонение (µ §, которое равно положительному значению корня квадратного из дисперсии. Среднее квадратическое отклонение имеет одинаковую размерность со случайной величиной.
Величины µ § и µ § показывают абсолютное отклонение от среднего значения случайной величины, что недостаточно характеризует уровень ее рассеивания. Относительной характеристикой рассеивания является коэффициент вариации, вычисляемый как отношение среднего квадратического отклонения и эмпирической средней:
µ §.
Коэффициент вариации может использоваться для сравнения меры рассеивания (колеблемости) случайных величин, имеющих различную размерность. Пример 1.2. Даны законы распределения двух независимых случайных величин: Х2468р0,40,20,10,3
Y012p0,50,20,3Найти математическое ожидание случайной величины Z = 2X + 3Y
Решение
Используя свойства математического ожидания, а также учитывая, что X и Y - независимые величины, имеем: M(Z) = M (2X + 3Y) = M(2X) + M(3Y) = 2M(X) + 3M(Y)
Тогда M(X) = 2*0,4+4*0,2+6*0,1+8*0,3 = 4,6
M(Y) = 0*0,5+1*0,2+2*0,3 = 0,8
M(Z) = 2*4,6+3*0,8 = 11,6
Статистическая оценка законов распределения случайных величин
Эмпирические ряды распределения, получаемые при обработке первичных статистических данных, оформляются в таблицах или изображаются графически посредством геометрических образов. Построение эмпирических графиков и диаграмм позволяет установить на первом этапе исследования, к какому типу теоретических распределений ближе всего полученное эмпирическое распределение, что облегчает выбор конкретных технических приемов обработки исходных данных.
Статистическая таблица ЁC система строк и столбцов, в которых в определенной последовательности и связи излагается статистическая информация о социально-экономических явлениях.
Статистические графики представляют собой условные изображения числовых величин и их соотношений посредством линий, геометрических фигур, рисунков или географических карт-схем.
По способу построения графики делятся на диаграммы, картограммы и картодиаграммы. Наиболее распространенными являются диаграммы. Они бывают разных видов: линейные, радиальные, точечные, плоскостные, объемные, фигурные.
На картограмме распределение изучаемого признака по территории изображается условными знаками (точками, штриховкой, цветом и т.д.), соответствующими определенным интервалам значений величины этого признака. Эти знаки покрывают контур каждого района. Картограмма применяется в тех случаях, когда возникает необходимость показать территориальное распределение какого-нибудь одного статистического признака между отдельными районами для выявления закономерностей этого распределения.
Картодиаграмма ЁC это сочетание диаграммы с географической картой. В качестве изобразительных знаков в картодиаграммах используются те или иные фигуры, которые размещаются на контуре географической карты. Картодиаграммы дают возможность графически отразить более сложные статистико-географические соотношения, чем картограммы.
Начальным этапом статистического изучения вариации является построение вариационного ряда ЁC упорядоченного распределения единиц совокупности по возрастающим (убывающим) значениям признака и подсчет числа единиц с тем или иным значением признака. Вариационный ряд часто называют рядом распределения.
Рассмотрим процедуру построения вариационного ряда. Для этого будем рассматривать некоторую случайную величину X. При функционировании экономической системы или ее элемента в течение некоторого времени t случайная величина X может принять п определенных значений. Совокупность этих случайных значений случайной величины в математической статистике называется статистической выборкой объема п. Если расположить отдельные значения случайной величины X в возрастающем или убывающем порядке и указать относительно каждого значения, как часто оно встречалось в данной совокупности, то получится эмпирическое распределение случайной величины, или вариационный ряд, на основании которого определяются аналитическая форма неизвестной плотности вероятности Дх, функция распределения F(x) и оцениваются входящие в нее параметры.
Весь диапазон значений непрерывной случайной величины X разбивается на интервалы. Далее подсчитывается количество значений mi, случайной величины X, приходящейся на каждый интервал, и определяется частота ее попадания в данный интервал по формуле:
µ §.
Если случайная величина X, принимает значение, попадающее на границу i-го и (i+1)-го интервалов, то это значение учитывается в числе попаданий в (i + 1)-й интервал.
Определив таким образом частоты попадания случайной величины X в каждый интервал, получим вариационный (статистический) ряд, который представляют в виде таблицы: Интервалµ §µ §ЎKµ §ЎKµ §Частота µ §µ §µ §ЎKµ §ЎKµ §
Оптимальная длина интервала определяется по формуле: µ §.
Хmax ЁC Х min - размах вариации случайной величины X.
Число интервалов будет равно:
k = µ §.
Если k не целое число, то в качестве числа интервалов надо взять ближайшее к k целое число, не меньшее k.
Вариационные ряды могут быть изображены графически в виде полигона распределения и гистограммы.
Полигон распределения представляет собой многоугольник, который строится на прямоугольной координатной сетке. В выбранных масштабах на оси абсцисс наносится шкала для фактических значений случайной величины X, на оси ординат ЎЄ для частот µ §.
Пользуясь этими шкалами, наносят точки M1 с координатами x1 и µ §. Точки µ § соединяют ломаной линией M1 M2 M3ЎKMiЎK.Mk. Крайние точки M1 и Mk, если они лежат на оси Ox, соединяют также со смежными точками соответственно Mo (Xo, 0) и Мk+1 (xk+1,0) на оси абцисс. Полученный таким образом многоугольник M0 M1 M2 ЎK. Mi ЎK. Mk Mk+1 является полигоном распределения.
Рис. 1.2. Полигон распределения реализаций случайной величины X Полигоны распределения чаше всего применяются для изображения дискретных вариационных рядов.
Гистограмма распределения реализаций случайной величины применяется для графического изображения интервальных рядов распределения. Она представляет собой многоугольник, построенный с помощью смежных прямоугольников. В случае непрерывных равных интервалов с шириной интервала Дх гистограмма строится следующим образом (рис. 1.3).
Рис. 1.3. Гистограмма распределения В выбранных масштабах на оси абсцисс наносится шкала для реализаций случайной величины X. на оси ординат ЁC величины µ § . Пользуясь этими шкалами, строят прямоугольники ABCD, DEFG,основания которых соответствуют ширине интервала Дх, а высоты равны отношениям µ § . Многоугольник ABCEF... QORJA и является гистограммой распределения.
Гистограммы чаще всего применяются для изображения вариационных рядов с непрерывными значениями случайной величины X. При уменьшении величины каждого интервала гистограмма будет приближаться к некоторой плавной кривой, соответствующей графику функции плотности распределения случайной величины X. Следовательно, в результате построения гистограммы можно получить представление о дифференциальном законе распределения случайной величины X.
Пример 1.3. Построить гистограмму и статистическую функцию распределения часовой выработки подвижного состава автопредприятия.
Значения часовой выработки получены в ходе наблюдения за работой автомобилей-самосвалов КамАЗ-5511 в течение календарного года. Объем выборки составил n = 100 наблюдений. Размах вариации равен:
µ §
Величина интервала вариационного ряда определена:
µ §
Количество интервалов вариационного ряда равно:
µ §
Вариационный ряд часовой выработки автомобиля представлен в таблице 1.1.
Таблица 1.1
Вариационный ряд часовой выработки автомобиля
Интервал µ §4-5,55,5-7,07,0-8,58,5- 1010-11,511,5-13,013,0-14,514,5-16Частота µ §0,070,140,170,170,150,140,110,05
Решение
Для построения гистограммы определим ее ординаты из выражения:
µ § µ § µ § µ § µ § µ § µ § µ § µ §
Основываясь на данных табл. 1.1 и проведенных расчетах построим гистограмму (рис. 1.4).
Следует отметить, что при неограниченном увеличении объема выборки п кривая гистограммы частот совпадает с графиком плотности вероятностей.
Построим статистическую функцию распределения часовой выработки автомобиля:
µ § µ §
µ § µ §
µ § µ §
µ § µ §
µ §
Рис. 1.4. Гистограмма часовой выработки автомобиля График статистической функции распределения представлен на рис. 1.5.
Рис. 1.5. Статистическая функция распределения часовой выработки автомобиля
Основные законы распределения случайных величин. Выбор теоретического закона распределения
Дискретные законы распределения
Биномиальное распределение
Это распределение числа X появления события А в серии из n независимых испытаний. Вероятность наступления события А в каждом испытании равна р, а вероятность его отсутствия q = 1 ЎЄр. В каждом испытании возможно два исхода: наступление или ненаступление события А. При сформулированных условиях ряд распределения числа появления события А определяется формулой Бернулли:
µ §
или µ §,
где P(x=m) ЁC вероятность появления события А равна т раз в серии из n испытаний.
Характер биномиального распределения определяется двумя параметрами: р и n. На рис. 1.6 показаны многоугольники биномиального распределения для некоторых значений этих величин.
Рис. 1.6. Примеры кривых биноминального распределения Числовые характеристики биномиального распределения случайной величины X:
• математическое ожидание М[Х] = п•р;
• дисперсия Dx = п • р • q = п • р(1 - р);
• коэффициент асимметрии (скошенности) распределения:
µ §;
• коэффициент эксцесса (мера крутости) распределения:
µ §.
Пример 1.4. Техническая система состоит из пяти независимо друг от друга функционирующих узлов. Определить математическое ожидание, дисперсию, среднее квадратическое отклонение числа отказов узлов, если вероятность отказа любого из них р = 0,2.
Решение
Математическое ожидание числа отказов: µ §
Дисперсия: µ §
Среднее квадратическое отклонение: µ §
Коэффициент асимметрии: µ §
Коэффициент эксцесса: µ § Распределение Пуассона
Данное распределение является предельным случаем биномиального распределения. Предположим, что в биномиальном распределении р µ § 0 и п µ §Ѓ‡, так, что п*р µ §М[Х] = а > 0. Тогда плотность вероятности биномиального распределения принимает вид:
µ § k=0,1,2,ЎK,
что и является распределением Пуассона. Распределение Пуассона зависит только от одного параметра ЁC математического ожидания М[Х] = а. Основные числовые характеристики случайной величины, имеющей распределение Пуассона, равны величине а > 0, а именно дисперсия случайной величины X, имеющей распределение Пуассона, численно равна ее математическому ожиданию. Этим свойством пользуются для оценки близости эмпирического распределения к распределению Пуассона. Пример 1.5. Определить вероятность того, что на АЗС находится один или хотя бы один автомобиль, если среднее число автомобилей, находящихся в данном интервале времени на АЗС, а = 3.
Решение
Вероятность нахождения одного автомобиля на АЗС следующая:
µ §
Вероятность того, что на АЗС будет находиться хотя бы один автомобиль, равна вероятности того, что на АЗС будет находиться не менее одного автомобиля, т. е.
µ §
Непрерывные распределения вероятностей
Нормальное распределение
Наиболее известным непрерывным распределением является нормальное. Плотность нормального распределения определяется по формуле:
µ §
Непрерывная случайная величина X принимает значения от -Ѓ‡ до +Ѓ‡. Соответствующая функция распределения равна:
µ §
Типичные графики плотности вероятности f(х) и функции нормального распределения приведены на рис. 1.7.
Рис. 1.7. Графики кривых нормального распределения Основные свойства нормального распределения:
нормальное распределение полностью характеризуется математическим ожиданием и дисперсией;
кривая плотности вероятности f(х)нормального распределения симметрична относительно математического ожидания тх. Максимум плотности распределения соответствует абсциссе, равной тх;
при |х| µ §Ѓ‡ ветви кривой распределения асимптотически приближаются к оси 0х;
математическое ожидание случайной величины X, распределенной в соответствии с нормальным законом, совпадает по величине с ее модой и медианой;
коэффициенты асимметрии и эксцесса нормального распределения равны нулю.
При значении уx = 1 и тх = 0 нормальную кривую называют нормированной, а соответствующий закон распределения ЎЄ стандартным нормальным законом распределения с плотностью:
µ §
Пример 1.6. Среднее время обслуживания персонального компьютера (ПК) t = 2 ч. Среднее квадратическое отклонение времени обслуживания равно уt = 0,403 ч. Определить вероятность окончания обслуживания ПК в течение интервала времени от 1,5 до 2,5 ч.
Решение
1. Вероятность попадания случайной величины t в интервал [1,5; 2,5] будет равна: µ §
2. Определим z: µ § µ §
µ § µ §
3. По таблицам «Функция распределения для закона Гаусса» определим значение стандартной нормальной функции распределения:
|