Элементы математической статистики





Скачать 178.52 Kb.
НазваниеЭлементы математической статистики
Дата публикации10.07.2013
Размер178.52 Kb.
ТипДокументы
100-bal.ru > Математика > Документы
Элементы математической статистики

  1. Введение. Много веков врачи принимали жизненно важные решения, вынося вердикт, как лучше всего лечить пациентов на основании небольшого количества, а то и при отсутствии каких-либо научных доказательств. Новые методы лечения обычно проверяли на небольшом количестве пациентов и часто получали противоречивые результаты. Классическим примером подобного исследования является попытка простого помощника корабельного врача шотландца Джеймса Линда в 1747 найти лекарство от цинги.

http://www.sweetstyle.ru/style/assets/images/new/life/kuk2.jpg
Линд (Lind) Джеймс (1716—13.7.1794, Госпорт), английский морской врач, основоположник морской гигиены в Великобритании. Медицинское образование получил в Эдинбурге; с 1758 и до конца жизни — врач Хасларского морского госпиталя. В 1753 дал подробное описание цинги и предложил способы её лечения и предупреждения. Описал заболевания европейцев в жарких странах, тифозную лихорадку, многие болезни матросов. Ввёл на кораблях ряд гигиенических приспособлений (прибор для получения пресной воды из морской и др.), предлагал использование специальных санаторных кораблей в тропических портах и др.
До открытия Линда цинга уносила 40% моряков королевского флота Великобритании. Линд был убежден, что причина болезни – плохое питание моряков. Он подобрал шесть пар пациентов, симптомы болезни которых подходили под описание цинги, и назначил им усиленное питание. Через неделю один курс лечения оказался особенно эффективным: ежедневная порция лимонов и апельсинов. Линд первым применил научно обоснованный подход в медицине и в результате открыл эффективное лечение от цинги. Но запутанный отчет о результатах исследованиях Линда и нехватка данных не убедили военно-морское министерство Великобритании – лишь через 40 лет фруктовые соки вошли в ежедневный рацион моряков. Несмотря на такое очевидное доказательство значимости научно обоснованного метода в медицине, медики не спешили приобретать так необходимые знания статистических методов для исследований.

Большой прорыв настал в 1940-х годах, когда в Совете медицинских исследований в Великобритании ввели рандомизированные контролируемые испытания (РКИ), для которых пациентов отбирали методом случайной выборки и проверяли на них новый метод лечения или уже существующий (или просто плацебо). Первые такие испытания были настолько успешными, что РКИ стали основой радикально нового направления, известного как научно обоснованный подход в медицине.

Знание основ математической статистики абсолютно необходимо для планирования, проведения и анализа научных исследований в медицине, является важным для понимания и критической оценки сообщений в медицинских журналах, монографиях, докладах и т.д.

Математическая статистика – раздел математики, посвященный математическим методам систематизации, обработки и использования статистических данных для научных и практических выводов.

Математическая статистика как наука начинается с работ знаменитого немецкого математика Карла Фридриха Гаусса (1777-1855), который на основе теории вероятностей исследовал и обосновал метод наименьших квадратов, созданный им в 1795 г. и примененный для обработки астрономических данных (с целью уточнения орбиты малой планеты Церера). Его именем часто называют одно из наиболее популярных распределений вероятностей – нормальное, а в теории случайных процессов основной объект изучения – гауссовские процессы.
http://www.blogodisea.com/wp-content/uploads/2009/01/gauss-carl-friedrich.jpg http://1.bp.blogspot.com/_k6w0shra1sk/srv0fsoxk0i/aaaaaaaacqo/qnav1pn2bps/s400/10dm_with_gauss_curve_detail.jpg
Иоганн Карл Фри́дрих Га́усс (нем. Johann Carl Friedrich Gauß; 30 апреля 1777(17770430), Брауншвейг23 февраля 1855, Гёттинген) — немецкий математик, астроном и физик, считается одним из величайших математиков всех времён, «королём математиков»[1]

В конце XIX в. – начале ХХ в. крупный вклад в математическую статистику внесли английские исследователи, прежде всего К.Пирсон (1857-1936) и Р.А.Фишер (1890-1962). В частности, Пирсон разработал критерий проверки статистических гипотез, а Фишер – дисперсионный анализ, теорию планирования эксперимента, метод максимального правдоподобия оценки параметров.

В 30-е годы ХХ в. поляк Ежи Нейман (1894-1977) и англичанин Э.Пирсон развили общую теорию проверки статистических гипотез, а советские математики академик А.Н. Колмогоров (1903-1987) и член-корреспондент АН СССР Н.В.Смирнов (1900-1966) заложили основы непараметрической статистики. В сороковые годы ХХ в. румын А. Вальд (1902-1950) построил теорию последовательного статистического анализа.

Очевидно, что теоретическим фундаментом математической статистики стала теория вероятностей.


  1. Случайные события и вероятности.

Исходное понятие теории вероятностей – опыт (испытание). Примерами опытов являются проверка качества единицы лекарственной продукции, бросание монет независимо друг от друга и т.д.

Первый шаг при построении вероятностной модели реального явления или процесса – выделение возможных исходов опыта. Их называют элементарными случайными событиями: А1А2,…, Аn. Совокупность случайных событий называется полной группой событий для данного испытания, если в результате испытания происходит только одно событие из совокупности.

Примеры: Обычно считают, что в первом опыте возможны два исхода – «единица продукции годная» и «единица продукции дефектная». Естественно принять, что при бросании монеты осуществляется одно из двух элементарных событий – «выпала решетка (цифра)» и «выпал герб».

События бывают достоверными (обязательно происходит) и невозможными

( не происходит в результате испытаний).

Перейдем к основному понятию теории вероятностей – понятию вероятности события. Вероятность Р(А) события является мерой возможности осуществления события.

Классическое определение вероятности случайного события для испытаний с конечным числом исходов, причем исходов равновероятных:

Вероятностью наступления случайного события А называют отношение количества m элементарных событий, в результате которых произошло бы событие А, к общему числу элементарных событий n:



Пример: Из соображений равновозможности: при бросании симметричной монеты и герб, и решетка имеют одинаковые шансы оказаться сверху, а именно, 1 шанс из 2, а потому вероятности выпадения герба и решетки равны 1/2.

Вероятность достоверного события равна 1, а невозможного – 0, т.о.
0 ˂P(A)˂ 1. В медицинских исследованиях достаточной считается вероятность появления события не менее 0,95. При изучении заболеваний и ситуаций, имеющих важнейшие медико-социальные последствия или высокие показатели летальности и инвалидности, а также при фармакологических исследованиях вероятность появления события должна быть не менее 0,99.

Статистический подход к определению вероятности случайного события при возможности неограниченного числа испытаний и отсутствия равной вероятности элементарных событий:

Относительная частота наступления данного события– это число, к которому приближается отношение количества осуществлений события А к общему числу всех опытов (т.е. частота осуществления события А) – при увеличении числа опытов, проводящихся независимо друг от друга.



Проиллюстрируем соотношение между двумя подходами к формированию понятия вероятности на следующем примере:
Эксперимент Пирсона:

Всего опытов

Выпал «орёл»

Статистическая вероятность, Р*(А)

Классическая вероятность, Р(А)

4

1

0,25

1/2

24000

12012

0,5005

1/2

Таким образом,


Случайная величина - это величина, которая в результате испытания примет одно и только одно возможное значение, наперед неизвестное и зависящее от случайных причин, которые заранее не могут быть учтены.

Будем обозначать случайные величины буквами латинского алфавита X, Y, Z


.Случайная величина бывает:

дискретной

непрерывной

дискретная случайная величина принимает конечное (или счетное) количество значений с определенными вероятностями.

непрерывная случайная величина может принимать все значения из некоторого конечного или бесконечного промежутка. Число возможных значений непрерывной случайной величины, независимо от величины промежутка, бесконечно.

Пример: число пациентов на приёме у врача. http://kp.ru/f/12/image/75/87/2258775.jpg



Пример: рост студентов - рост студента может принимать любое значение из числового промежутка 1 м до 2,5 м. Число возможных значений - бесконечно.

рост студентов



  1. Закон распределения дискретной случайной величины

Для задания дискретной случайной величины недостаточно перечислить все ее возможные значения, нужно указать еще и их вероятность.

Законом распределения дискретной случайной величины называют соответствие между возможными значениями случайной величины и вероятностями их появления.

Закон распределения можно задать таблично, аналитически (в виде формулы) или графически (в виде многоугольника распределения).

Рассмотрим случайную величину X, которая принимает значения x1, x2, x3 ... xn с некоторой вероятностью pi, где i = 1.. n. Сумма вероятностей pi равна 1.

сумма вероятностей

Таблица соответствия значений случайной величины и их вероятностей вида

x1

x2

x3

...

xn

...

p1

p2

p3




pn




называется рядом распределения дискретной случайной величины или просто рядом распределения. Эта таблица является наиболее удобной формой задания дискретной случайной величины.

Графическое представление этой таблицы называется многоугольником распределения. По оси абсцисс откладываются возможные значения дискретной случайной величины, а по оси ординат соответствующие вероятности.

многоугольник распределения


  1. Числовые характеристики дискретных случайных величин

Закон распределения полностью характеризует дискретную случайную величину. Однако, когда невозможно определить закон распределения, или этого не требуется, можно ограничиться нахождением значений, называемых числовыми характеристиками случайной величины:

  • Математическое ожидание,

  • Дисперсия,

  • Среднее квадратичное отклонение

Эти величины определяют некоторое среднее значение, вокруг которого группируются значения случайной величины, и степень их разбросанности вокруг этого среднего значения.

Математическое ожидание M дискретной случайной величины - это среднее значение случайной величины, равное сумме произведений всех возможных значений случайной величины на их вероятности.

http://flash-library.narod.ru/it-mathsredstva/lab-rab/ris/lab1eqn03.gif

Для описания многих практически важных свойств случайной величины необходимо знание не только ее математического ожидания, но и отклонения возможных ее значений от среднего значения.

Дисперсия случайной величины — мера разброса случайной величины, равная математическому ожиданию квадрата отклонения случайной величины от ее математического ожидания.

дисперсия

Принимая во внимание свойства математического ожидания, легко показать что

дисперсия случайной величины

Казалось бы, естественным рассматривать не квадрат отклонения случайной величины от ее математического ожидания, а просто отклонение. Однако математическое ожидание этого отклонения равно нулю. Это объясняется тем, что одни возможные отклонения положительны, другие отрицательны, и в результате их взаимного погашения получается ноль. Можно было бы принять за меру рассеяния математическое ожидание модуля отклонения случайной величины от ее математического ожидания, но, как правило, действия связанные с абсолютными величинами, приводят к громоздким вычислениям.

Средним квадратическим отклонением случайной величины (иногда применяется термин «стандартное отклонение случайной величины») называется число равное

среднее квадратическое отклонение

Среднее квадратическое отклонение, следовательно, является, как и дисперсия, мерой рассеяния распределения, но измеряется, в отличие от дисперсии, в тех же единицах, которые используют для измерения значений случайной величины.

Задача: На приёме у врачей разного профиля было соответственно 10,9,11,10,12,8,11,9,10,10,11,8,9,10,9,11,12,10,9,11 пациентов. Составьте закон распределения случайной величины Х, определяемой как число пациентов на приёме у произвольно выбранного специалиста и найдите основные числовые характеристики случайной величины числа пациентов.


  1. Основы выборочного метода.




    1. Генеральная и выборочная совокупности

Генеральной совокупностью называется совокупность объектов или наблюдений, все элементы которой подлежат изучению при статистическом анализе.

В математической статистике генеральная совокупность часто понимается как совокупность всех мыслимых наблюдений, которые могли быть произведены при выполнении данного комплекса условий. Число объектов (наблюдений) в генеральной совокупности называется ее

объемом.

Изучение всего набора элементов генеральной совокупности часто оказывается невозможным, в таких случаях рассматривают некоторую часть объема.

Часть объектов генеральной совокупности, используемая для исследования, называется выборочной совокупностью или выборкой.

Описательная статистика сжато описывает полученные статистические данные для какой-либо выборки.
Пример. Число единиц лекарственного средства N, произведенного фирмой в течение года, есть конечная генеральная совокупность. Для исследования качества продукции на практике рассматривается выборка, состоящая из п единиц товара. Признаком, или случайной величиной, может быть число единиц товара, удовлетворяющих сертификатным требованиям.

Сущность выборочного метода в математической статистике заключается в том, чтобы по определенной части генеральной совокупности (выборке) судить о ее свойствах в целом.

Выборочный метод является единственно возможным в случае бесконечной генеральной совокупности или когда исследование связано с уничтожением (гибелью) наблюдаемых объектов (например, исследование предельных режимов приборов, исследование действия вирусов на подопытных животных и т.д.). Для того чтобы по выборке можно было адекватно судить о случайной величине, она должна быть представительной (репрезентативной). Репрезентативность выборки обеспечивается случайностью отбора ее элементов, так как все элементы генеральной совокупности должны иметь одинаковую вероятность попадания в выборку.


    1. Точечные оценки основных числовых характеристик генеральной совокупности и .


Рассмотрим генеральную совокупность всех первокурсников страны, т.е. генеральную совокупность из nобъектов. Пусть надо узнать их средний рост. Но, как правило, измерить все объекты генеральной совокупности не представляется возможным, или это просто нецелесообразно - всю жизнь можно потратить на это. А проблему решать надо.

Вот тогда и используется математическая статистика - она оценивает все неизвестные параметры генеральной совокупности: генеральную среднюю, генеральную дисперсию, генеральное среднее квадратическое отклонение на основании точного расчета свойств выборки объема n.

5.2.1.Генеральная средняя.

Пусть изучается генеральная совокупность относительно количественного признака Х.

Генеральной средней называют среднее арифметическое значений признака генеральной совокупности.

http://apollyon1986.narod.ru/docs/tvims/np/lekziitv/lek262.gif

Эта формула имеет лишь теоретическое значение, ведь на практике имеют дело с выборками из генеральных совокупностей.

5.2.2.Выборочная средняя.

Пусть для изучения генеральной совокупности относительно количественного признака Х извлечена выборка объема n.

Выборочной средней называют среднее арифметическое значение признака выборочной совокупности.

Если все значения признака выборки различны, то


Выборочная средняя представляет собой наилучшую оценку генеральной средней.

5.2.3. Генеральная дисперсия.

Для того чтобы охарактеризовать рассеяние значений количественного признака Х генеральной совокупности вокруг своего среднего значения, вводят сводную характеристику — генеральную дисперсию.

Генеральной дисперсией Dг называют среднее арифметическое квадратов отклонений значений признака генеральной совокупности от их среднего значения.

Если все значения признака генеральной совокупности объема N различны, то

http://apollyon1986.narod.ru/docs/tvims/np/lekziitv/lek267.gif

Кроме дисперсии для характеристики рассеяния значений признака генеральной совокупности вокруг своего среднего значения пользуются сводной характеристикой— средним квадратическим отклонением.

Генеральным средним квадратическим отклонением (стандартом) называют квадратный корень из генеральной дисперсии:

http://apollyon1986.narod.ru/docs/tvims/np/lekziitv/lek269.gif

5.2.4.Выборочная дисперсия.

Для того, чтобы наблюдать рассеяние количественного признака значений выборки вокруг своего среднего значения, вводят сводную характеристику - выборочную дисперсию.

Выборочной дисперсией называют среднее арифметическое квадратов отклонения наблюдаемых значений признака от их среднего значения.

Если все значения признака выборки различны, то

http://apollyon1986.narod.ru/docs/tvims/np/lekziitv/lek270.gif
Для характеристики рассеивания значений признака выборки вокруг своего среднего значения пользуются сводной характеристикой - средним квадратическим отклонением.

Выборочным средним квадратическим отклоненим называют квадратный корень из выборочной дисперсии:

http://apollyon1986.narod.ru/docs/tvims/np/lekziitv/lek272.gif

Вычисление дисперсии выборочной или генеральной, можно упростить, используя формулу:

http://apollyon1986.narod.ru/docs/tvims/np/lekziitv/lek273.gif

Но наилучшей оценкой генеральной дисперсии представляет исправленная выборочная дисперсия.

5.2.5.Исправленная дисперсия.

Выборочная дисперсия является смещенной оценкой генеральной дисперсии, т.е. математическое ожидание выборочной дисперсии не равно оцениваемой генеральной дисперсии, поэтому в качестве оценки генеральной дисперсии принимают исправленную выборочную дисперсию.

Для оценки среднего квадратического генеральной совокупности используют исправленное среднее квадратическое отклонение

http://apollyon1986.narod.ru/docs/tvims/np/lekziitv/lek276.gif

Замечание: формулы для вычисления выборочной дисперсии и исправленной дисперсии отличаются только знаменателями. При достаточно больших n выборочная и исправленная дисперсии мало отличаются, поэтому на практике исправленной дисперсией пользуются, если n<30.


    1. Интервальная оценка числовых основных числовых характеристик генеральной совокупности (n<30).

Интервальной называют оценку, которая определяется двумя числами—концами интервала. Интервальная оценка - оценка представляемая интервалом значений, внутри которого с задаваемой исследователем вероятностью находится истинное значение оцениваемого параметра (генеральная средняя). Интервал в интервальной оценке называется доверительным интервалом, задаваемая исследователем вероятность называется доверительной вероятностью.  В практике статистических вычислений применяются стандартные значения доверительной вероятности: 0,95, 0,98 и 0,99 (95%, 98% и 99% соответственно). Например, интервальная оценка математического ожидания (3,8) при доверительной вероятности 0,95. Это означает, что математическое ожидание лежит в пределах от 3 до 8 с вероятностью 0,95, следовательно, вероятность того, что математическое ожидание меньше 3 или больше 8 не превышает 0,05. Очевидно, что чем выше доверительная вероятность, тем выше точность оценки, но шире доверительный интервал. Отсюда следует – для непрерывных случайных величин вероятность того, что точечная оценка совпадает с оцениваемым параметром равна 0.

Пусть известна выборка: х1, х2, ..., хn, где n – объем выборки (n˂30), то можно рассчитать ее характеристики:

выборочное среднее ,

исправленная выборочная дисперсия ,

выборочное среднеквадратическое отклонение .

Тогда полуширина доверительного интервала для генерального среднего рассчитывается по формулу, где t – коэффициент Стьюдента, – доверительная вероятность, f = n1 – степень свободы (число независимых случайных величин, по которым вычисляется данная статистика).

.Верхняя и нижняя границы доверительного интервала определятся по формулам:

Х min = , где

Х mах = , где .

Можно применять и другой вариант этой формулы: ,

где Р – доверительная вероятность, а n – число наблюдений.

Таблица значений коэффициента Стьюдента.

http://www.micromake.ru/old/msisbook/msisstand/koefstud.gif

В данной таблице n – число наблюдений, а Р - доверительная вероятность.
картинка 3 из 16

Распределение Стьюдента, коэффициенты Стьюдента были введены в 1908 г. английским статистиком Вильямом Госсетом, работавшем на фабрике, выпускающей пиво. Вероятностно-статистические методы использовались для принятия экономических и технических решений на этой фабрике, поэтому ее руководство запрещало В. Госсету публиковать научные статьи под своим именем. Таким способом охранялась коммерческая тайна, «ноу-хау» в виде вероятностно-статистических методов, разработанных В. Госсетом. Однако он имел возможность публиковаться под псевдонимом «Стьюдент». История Госсета - Стьюдента показывает, что еще сто лет назад менеджерам Великобритании была очевидна большая экономическая эффективность вероятностно-статистических методов.
Пример: Найти доверительный интервал для оценки математического ожидания с надежностью 0,95, если объем выборки n =16, среднее выборочное и исправленная дисперсия соответственно равны 20,2 и 0,8.

По таблице приложения найдем t по заданной надежности  =0,95 и n= 16: t =2,13. Подставим в формулу s =0,8 и t =2,13 , вычислим границы доверительного интервала:

http://apollyon1986.narod.ru/docs/tvims/np/lekziitv/lek296.gif,

откуда получим доверительный интервал (19,774; 20,626)

Смысл полученного результата: если взять 100 различных выборок, то в 95 из них математическое ожидание будет находится в пределах данного интервала, а в 5 из них- нет.

Для вычислений точечной и интервальных оценок можно использовать статистические функции Excel.


Добавить документ в свой блог или на сайт

Похожие:

Элементы математической статистики iconМетодические указания к типовому расчету по разделу «Элементы математической...
Сборник заданий к типовому расчету по математической статистике: учебно-методическое пособие/ Л. А. Секованова, Т. А. Андревкина,...
Элементы математической статистики iconРабочая программа по дисциплине В. В методы математической статистики в бжд в техносфере
Дисциплина «Методы математической статистики в бжд в техносфере» является одной из важнейших дисциплин естественнонаучного цикла
Элементы математической статистики iconИстоками математической статистики (М. С.) является большой объем...
Истоками математической статистики (М. С.) является большой объем статистических данных и потребность после их специальной обработки...
Элементы математической статистики iconПонятие статистики. 3 История математической статистики. 4 Простейшие...
Рудольфовны, что означают незнакомые мне слова – размах, мода, медиана, среднее. Получив ответ, я ничего не поняла. Под конец 2 четверти...
Элементы математической статистики iconФедеральная служба государственной статистики умо вузов российской...
Московский государственный университета экономики, статистики и информатики (мэси)
Элементы математической статистики iconПрограмма по формированию навыков безопасного поведения на дорогах...
Основы дискретной математики, теории вероятностей, математической статистики и их роль в медицине и здравоохранении
Элементы математической статистики iconРоссийской Федерации Федеральное государственное бюджетное образовательное...
Целью изучения дисциплины является освоение базовых понятий, методов и принципов теории вероятностей и математической статистики
Элементы математической статистики iconРеферат «Методы математической статистики» Научно-практическая конференция...
Творческие работы учащихся по предмету (проекты, исследования и др.), представленные учениками Претендента на конкурсах, фестивалях...
Элементы математической статистики iconДоклад Александра Суринова, руководителя Федеральной службы государственной...
«20 лет модернизации российской статистики: опыт и перспективы», посвященной 150 – летию Центрального статического Управления в России...
Элементы математической статистики iconРеферат по дисциплине “Основы математической обработки информации” на тему: Отрасли статистики
Федеральное государственное бюджетное образовательное учреждение высшего профессионального образования «Волгоградский государственный...
Элементы математической статистики iconКонспект лекций по теории вероятностей и математической статистики....
Эвм). Устранимая и неустранимая погрешности. Абсолютная и относительная погрешности, математические операции над погрешностями (складывание,...
Элементы математической статистики iconЭлементы комбинаторики, статистики и теориивероятностей
В контрольно-измерительные материалы егэ задача по стохастике впервые была включена в 2012 году. Ниже приведена общая характеристика...
Элементы математической статистики iconПрофессионального Образования «Православный Свято-Тихоновский Гуманитарный Университет»
«Введение в социологию», общую философскую подготовку, осуществляемую в рамках таких дисциплин, как «Введение в философию», «История...
Элементы математической статистики iconПрофессионального Образования «Православный Свято-Тихоновский Гуманитарный Университет»
«Введение в социологию», общую философскую подготовку, осуществляемую в рамках таких дисциплин, как «Введение в философию», «История...
Элементы математической статистики iconФедеральной службы государственной статистики по курганской области
«промежуточные комплексы, более сложные, чем элементы, но менее сложные, чем сама система»
Элементы математической статистики iconРабочая программа По математике 11 класс
«Алгебра», «Функции», «Уравнения и неравенства», «Геометрия», «Элементы комбинаторики, теории вероятностей, статистики и логики»,...


Школьные материалы


При копировании материала укажите ссылку © 2013
контакты
100-bal.ru
Поиск