МАТЕРИАЛЫ ПРАКТИЧЕСКИХ ЗАНЯТИЙ по дисциплине «Теория информации» Специальность 230102.65 - Автоматизированные системы обработки информации и управления
Форма подготовки - очная
г. Владивосток
2011 Целями проведения лабораторно-практических работ являются:
− установление связей теории с практикой в форме экспериментального подтверждения положений теории;
− обучение студентов умению анализировать полученные результаты;
− контроль самостоятельной работы студентов по освоению курса;
− обучение навыкам профессиональной деятельности
Цели практикума достигаются наилучшим образом в том случае, если выполнению эксперимента предшествует определенная подготовительная внеаудиторная работа. Поэтому преподаватель обязан довести до всех студентов график выполнения лабораторных работ с тем, чтобы они могли заниматься целенаправленной домашней подготовкой.
Перед началом очередного занятия преподаватель должен удостовериться в готовности студентов к выполнению работы путем короткого собеседования и проверки наличия у студентов заготовленных протоколов проведения работы.
Лабораторные работы (36 час.)
Лабораторная работа № 1 Расчет вероятностей информационных состояний (12 час)
Вариант 1.
1. Три стрелка стреляют в цель независимо друг от друга. Первый стрелок попадает в цель с вероятностью 0,6, второй – с вероятностью 0,7, а третий – с вероятностью 0,75. Найти вероятность хотя бы одного попадания в цель, если каждый стрелок сделает по одному выстрелу.
2. Ожидается прибытие трех судов с фруктами. Статистика показывает, что 1% судов привозит товар, непригодный к пользованию. Найти вероятность того, что
а) хотя бы два судна привезут качественный товар;
б) ни одно судно не привезет качественный товар.
3. В среднем 5% студентов финансово-кредитного факультета сдают экзамен по высшей математике на «отлично». Найти вероятность того, что из 100 наудачу выбранных студентов этого факультета сдадут экзамен по математике на «отлично»:
а) два студента;
б) не менее пяти студентов.
4. Законы распределения случайных величин X и Y заданы таблицами:
Х:
| xi
| 0
| 1
|
| Y:
| yi
| -1
| 2
| 3
| pi
| ?
| 0,4
|
| pi
| 0,3
| ?
| 0,5
|
Найти:
а) вероятности P(X = 0) и P(Y = 2);
б) закон распределения случайной величины Z = X – Y;
в) дисперсию D(Z).
5. Объем продаж в течение месяца – это случайная величина, подчиненная нормальному закону распределения с параметрами а = 500 и = 120. Найти вероятность того, что объем товара в данном месяце заключен в границах от 480 до 600.
Вариант 2.
1. Среди 20 одинаковых по внешнему виду тетрадей 16 в клетку. Наудачу взяли 4 тетради. Найти вероятность того, что из них
а) две тетради в клетку;
б) хотя бы одна тетрадь в клетку.
2. С конвейера сходит в среднем 85% изделий первого сорта. Сколько изделий необходимо взять, чтобы с вероятностью 0,997 отклонение доли изделий первого сорта среди отобранных от 0,85 не превосходило 0,01 (по абсолютной величине).
3. Из поступивших в магазин телефонов третья часть белого цвета, однако, определить цвет можно только после вскрытия упаковки. Найти вероятность того, что из шести распакованных телефонов
а) два аппарата белого цвета;
б) хотя бы один аппарат белого цвета.
4. Закон распределения дискретной случайной величины X имеет вид:
xi
| -4
| -1
| 1
| 3
| 4
| 6
| pi
| 0,1
| 0,2
| 0,1
| 0,1
| 0,4
| 0,1
|
Необходимо:
а) составить законы распределения случайных величин Y = 2X и Z = X2 ;
б) вычислить математическое ожидание и дисперсию случайной величины Y;
в) построить график функции распределения случайной величины Z.
5. Суточный расход воды в населенном пункте является случайной величиной, среднее квадратическое отклонение которой равно 10000 л. Оценить вероятность того, что расход воды в этом пункте в течение дня отклонится от математического ожидания не более чем на 25000 л (по абсолютной величине). Лабораторная работа № 2 «Информационные статистические задачи» (12 час)
По данным задачи 1, используя критерий 2 - Пирсона, при уровне значимости α = 0,05 проверить гипотезу о том, что случайная величина Х – сумма вклада – распределена по нормальному закону. Построить на одном чертеже гистограмму эмпирического распределения и соответствующую нормальную кривую.
. Распределение 250 пар, вступивших в брак, по возрасту мужчин Х (лет) и женщин Y (лет) представлено в таблице:
y
x
| 15 - 25
| 25 - 35
| 35 - 45
| 45 - 55
| 55 - 65
| Итого:
| 15 - 25
| 7
| 3
|
|
|
| 10
| 25 - 35
| 52
| 110
| 13
| 1
|
| 176
| 35 - 45
| 1
| 14
| 23
| 2
|
| 40
| 45 - 55
|
| 1
| 4
| 6
| 1
| 12
| 55 - 65
|
|
|
| 3
| 6
| 9
| 65 - 75
|
|
|
|
| 3
| 3
| Итого:
| 60
| 128
| 40
| 12
| 10
| 250
|
Необходимо:
1) Вычислить групповые средние , построить эмпирические линии регрессии.
2) Предполагая, что между переменными X и Y существует линейная корреляционная зависимость: а) найти уравнения прямых регрессии, построить их графики на одном чертеже с эмпирическими линиями регрессии и дать содержательную интерпретацию полученных уравнений; б) вычислить коэффициент корреляции на уровне значимости α = 0,05, оценить его значимость и сделать вывод о тесноте и направлении связи между переменными X и Y; в) используя соответствующее уравнение регрессии, оценить средний возраст мужчин, имеющих супруг в возрасте 30 лет. Образец выполнения Лабораторной работы №2
Вариант 1. 1. Решение.
От интервального распределения перейдем к дискретному, взяв в качестве представителя интервала его середину .
Для расчета выборочной средней и выборочной дисперсии составим таблицу.
Сумма вклада, тыс. руб.
| Количество вкладов, ni
| Середина, хi
| хi - C
|
|
|
| 50 - 150
| 14
| 100
| -200
| -2
| -28
| 56
| 150 - 250
| 24
| 200
| -100
| -1
| -24
| 24
| 250 - 350
| 35
| 300
| 0
| 0
| 0
| 0
| 350 - 450
| 20
| 400
| 100
| 1
| 20
| 20
| 450 - 550
| 7
| 500
| 200
| 2
| 14
| 28
| Суммы
| 100
|
|
|
| -18
| 128
|
С = 300 - середина интервала с наибольшей частотой;
k = 100 - величина интервала.
Выборочное среднее найдем по формуле
282 тыс. руб.
Выборочная дисперсия
,
12476.
Выборочное среднее квадратическое отклонение
111,696.
а) Средняя квадратическая ошибка среднего значения признака для бесповторной выборки .
Число всех вкладов N = 2000, объем выборки n = 100
10,8868.
Вероятности β = 0,9488 соответствует t = 1,95, так как Ф(1,95) = 0,9488.
Предельная ошибка 1,95 10,8868 21,2270.
Нижняя граница 282 - 21,227 = 260,773,
верхняя граница 282 + 21,227 = 303,227.
С вероятностью 0,9488 средняя сумма всех вкладов в сберегательном банке заключена в границах от 260,773 до 303,227 тыс. руб. б) Вероятности Р = 0,9 соответствует t = 1,64, так как Ф(1,64) = 0,9. Число вкладчиков, которых надо обследовать для повторной выборки
74,912.
Для бесповторной выборки
72,207. Округляем до большего целого 73.
Чтобы с вероятностью 0,9 гарантировать те же границы для средней суммы всех вкладов в сберегательном банке, что и в п. а) объем бесповторной выборки должен быть равным 73 вкладам.
в) Выборочная доля вкладчиков, у которых сумма вклада больше 250 тыс. руб., равна 0,62.
Средняя квадратическая ошибка доли для бесповторной выборки
0,0473 0,047.
Предельная ошибка Δ = 0,1. 0,1 / 0,0473 2,11.
Находим требуемую вероятность P = Ф(tβ) = Ф(2,11) = 0,9651
Вероятность того, что доля всех вкладчиков, у которых сумма вклада больше 250 тыс. руб., отличается от доли таких вкладчиков в выборке не более чем на 0,1(по абсолютной величине), приближенно равна 0,9651.
2. Решение.
Проверяется гипотеза Н0: случайная величина Х – сумма вклада – распределена по нормальному закону. Функция плотности вероятности и функция распределения имеют вид
, где а, - параметры распределения.
В качестве оценок этих параметров возьмем выборочное среднее значение и дисперсию.
282; = 111,696.
Тогда и .
Вычислим наблюдаемое значение критерия Пирсона по формуле
, где
m - число интервалов; ni - частота (эмпирическая); n - объем выборки; pi - теоретическая
вероятность попадания случайной величины в i-ый интервал; npi - теоретическая частота.
Вероятность pi попадания случайной величины Х в интервал (xi ; xi+1 ) найдем по формуле
pi = P (xi < X < xi+1) =
.
= 0,5 (Ф(-1,18) - Ф(-2,08)) = 0,5 (-0,7620 + 0,9625) = 0,1002.
= 0,5 (Ф(-0,29) - Ф(-1,18)) = 0,5 (-0,2282 + 0,7620) = 0,2669.
= 0,5 (Ф(0,61) - Ф(-0,29)) = 0,5 (0,4581 + 0, 2282) = 0,3432.
= 0,5 (Ф(1,50) - Ф(0,61)) = 0,5 (0,8664 - 0,4581) = 0,2041.
= 0,5 (Ф(2,40) - Ф(1,50)) = 0,5 (0,9836 - 0,8664) = 0,0586. Для расчета составим вспомогательную таблицу
i
| Интервал (xi ; xi+1)
| Эмпирические частоты ni
| Вероятность pi
| Теоретические частоты npi
| ni - npi
| (ni - npi)2
| (ni - npi)2 / npi
| 1
| 50 - 150
| 14
| 0,1002
| 10,020
| 3,980
| 15,8404
| 1,5809
| 2
| 150 - 250
| 24
| 0,2669
| 26,690
| -2,690
| 7,2361
| 0,2711
| 3
| 250 - 350
| 35
| 0,3432
| 34,320
| 0,680
| 0,4624
| 0,0135
| 4
| 350 - 450
| 20
| 0,2041
| 20,410
| -0,410
| 0,1681
| 0,0082
| 5
| 450 - 550
| 7
| 0,0586
| 5,860
| 1,140
| 1,2996
| 0,2218
|
| Суммы
| 100
| 0,9730
| 97,300
|
|
| 2,0955
|
2,0955.
Найдем по таблице критическое значение критерия , k = m – s – 1 , m = 5 - число интервалов, s = 2 - число параметров распределения, = 0,05 - уровень значимости, k = 5 - 2 - 1 = 2, = 5,99.
Сравниваем наблюдаемое значение критерия с критическим
2,0955 < 5,99. Это означает, что наблюдаемое значение не попало в критическую область. Поэтому гипотеза о нормальном распределении размера кредита согласуется с данными выборки и должна быть принята.
Гистограмма - это совокупность прямоугольников, основаниями которых служат частичные интервалы (xi; xi+1], а высота которых равна .
ki = xi+1 - xi - длина частичного интервала, ki = 100, n ki = 100 100 = 10000 , , , ,
.
Для построения графика нормальной кривой отметим точки (xi; pi/k), где xi - середина интервала, pi - вероятность попадания в интервал. Вершина при х = а = 282. 0,0574.
p1 / k = 0,1002 / 100 = 0,0010 p2 / k = 0,2669 / 100 = 0,0027
p3 / k = 0,3432 / 100 = 0,0034 p4 / k = 0,2041 / 100 = 0,0020
p5 / k = 0,0586 / 100 = 0,0006
3. Решение.
По исходным данным составим корреляционную таблицу, где интервалы представлены своими серединами.
yj
xi
| 20
| 30
| 40
| 50
| 60
| ni
| 20
| 7
| 3
|
|
|
| 10
| 30
| 52
| 110
| 13
| 1
|
| 176
| 40
| 1
| 14
| 23
| 2
|
| 40
| 50
|
| 1
| 4
| 6
| 1
| 12
| 60
|
|
|
| 3
| 6
| 9
| 70
|
|
|
|
| 3
| 3
| nj
| 60
| 128
| 40
| 12
| 10
| 250
|
1) Найдем групповые средние по Y по формуле .
x1 = 20 (20 7 + 30 3) / 10 = 230 / 10 = 23,000
x2 = 30 (20 52 + 30 110 + 40 13 + 50 1) / 176 = 4910 / 176 = 27,898
x3 = 40 (20 1 + 30 14 + 40 23 + 50 2) / 40 = 1460 / 40 = 36,500
x4 = 50 (30 1 + 40 4 + 50 6 + 60 1) / 12 = 550 / 12 = 45,833
x5 = 60 (50 3 + 60 6) / 9 = 510 / 9 = 56,667
x6 = 70 60 3 / 3 = 60,000 Составим таблицу 2.
|
|
|
|
| Таблица 2
| xi
| 20
| 30
| 40
| 50
| 60
| 70
|
| 23,000
| 27,898
| 36,500
| 45,833
| 56,667
| 60,000
|
По точкам (хi; ) построим эмпирическую линию регрессии Y на X. Эти точки расположены вблизи прямой с уравнением y = ax + b, где a и b неизвестные параметры и их нужно определить.
Групповые средние по Х найдем по формуле .
y1 = 20 (20 7 + 30 52 + 40 1) / 60 = 1740 / 60 = 29,000
y2 = 30 (20 3 + 30 110 + 40 14 + 50 1) / 128 = 3970 / 128 = 31,016
y3 = 40 (30 13 + 40 23 + 50 4) / 40 = 1510 / 40 = 37,750
y4 = 50 (30 1 + 40 2 + 50 6 + 60 3) / 12 = 590 / 12 = 49,167
y5 = 60 (50 1 + 60 6 + 70 3) / 10 = 620 / 10 = 62,000
Составим таблицу 3
|
|
|
| Таблица 3
|
| 29,000
| 31,016
| 37,750
| 49,167
| 62,000
| yj
| 20
| 30
| 40
| 50
| 60
|
По точкам (; yj) построим эмпирическую линию регрессии X на Y. Эти точки расположены вблизи прямой с уравнением x = cy + d, где c и d неизвестные параметры и их нужно определить.
Для получения уравнений прямых регрессий вычислим выборочные средние
и .
33,72
31,36
Выборочные дисперсии находим по формулам и
1214
1214 – 33,722 = 76,9616.
1076,8
1076,8 – 31,362 = 93,3504.
Вычислим средние квадратические отклонения
8,7728; 9,6618.
Вычислим по формуле .
= (20 20 7 + 20 30 3 + 30 20 52 + 30 30 110 + 30 40 13 + 30 50 1 +
+ 40 20 1 + 40 30 14 + 40 40 23 + 40 50 2 + 50 30 1 + 50 40 4 +
+ 50 50 6 + 50 60 1 + 60 50 3 + 60 60 6 + 70 60 3) / 250 – 33,72 31,36 =
= 281000 / 250 – 1057,4592 = 1124 – 1057,4592 = 66,5408.
Вычислим коэффициенты регрессии по формулам
66,5408 : 76,9616 0,8646 0,865;
66,5408 : 93,3504 0,7128 0,713.
а) Составим уравнение регрессии X на Y
x – 33,72 = 0,713 ( y – 31,36 ) или x = 0,713 y + 11,366.
Прямую проведем через точки (33,72; 31,36) и (11,366; 0,00).
Уравнение регрессии X на Y показывает средний возраст мужчины, вступившего в брак с женщиной возраста y.
Содержательный смысл коэффициента регрессии 0,713 состоит в том, что при увеличении возраста женщины, вступающей в брак, на 1 год возраст супруга увеличивается в среднем на 0,713 года.
Составим уравнение регрессии Y на X
y – 31,36 = 0,865 (x – 33,36) или y = 0,865 x + 2,206.
Прямую проведем через точки (33,72; 31,36) и (0,00; 2,206).
Уравнение регрессии Y на X показывает средний возраст женщины, вступившей в брак с мужчиной возраста х.
Содержательный смысл коэффициента регрессии 0,865 состоит в том, что при увеличении возраста мужчины, вступающего в брак, на 1 год возраст супруги увеличивается в среднем на 0,865 года.
б) Коэффициент корреляции 0,7850.
Для проверки значимости коэффициента корреляции вычислим наблюдаемое значение
; 19,958.
Критическое значение для уровня значимости α = 0,05 и числа степеней свободы k = n–2= = 250 -2 = 248 находим по таблице t1- 0,05;248 = t0,95;248 = 1,97.
Получили |tнабл| > tкр, так как 19,958 > 1,97.
Следовательно, коэффициент корреляции значимо отличается от нуля.
Коэффициент корреляции r = 0,7851 > 0 и попадает по абсолютной величине в интервал 0,7 - 0,99. Следовательно, между возрастом вступающих в брак мужчины (Х) и женщины (Y) существует прямая сильная корреляционная связь. При увеличении (уменьшении) значения одной величины соответственно увеличивается (уменьшается) среднее значение другой.
в) Используем уравнение прямой регрессии Х на Y x = 0,713 y + 11,366.
При y = 30 х = 0,713 30 + 11,366 = 32,756.
Средний возраст мужчин, имеющих супруг в возрасте 30 лет, равен 32,756 лет.
|