Статистические методы (собственно выборка) Определение допустимости применения статистических методов
В теории статистики основным условием статистического выборочного количественного исследования является соответствие данных тестируемой генеральной совокупности теории нормального распределения.
Рис. 1. Распределение всех элементов совокупности по стоимости Подобное распределение значений элементов генеральной совокупности (как на рис.1) называют нормальным.
В основе выборочного исследования лежит математически доказанная теорема, что при достаточно большом объеме выборки, сформированной по всем правилам, распределение элементов выборки будет таким же как и в генеральной совокупности с вероятностью, стремящейся к единице37.
Возьмем условный пример начислений по заработной плате на бухгалтерских счетах: Таблица. Элементы условной генеральной совокупности
-
Дата
| Дебет
| Кредит
| Сумма операции, рублей
| 31.05.05
| 23.1
| 70
| 10,00
| 31.05.05
| 25
| 70
| 5,00
| 31.05.05
| 26
| 70
| 20,00
| 30.06.05
| 23.1
| 70
| 10,00
| 30.06.05
| 25
| 70
| 10,00
| 30.06.05
| 26
| 70
| 20,00
| 31.07.05
| 23.1
| 70
| 10,00
| 31.07.05
| 25
| 70
| 15,00
| 31.07.05
| 26
| 70
| 20,00
| 31.08.05
| 23.1
| 70
| 15,00
| 31.08.05
| 25
| 70
| 10,00
| 31.08.05
| 26
| 70
| 25,00
| Итого
| 12 операций
|
| 170,0
| Генеральная средняя
| 14,17
|
Необходимо определить, соответствует ли распределение данных генеральной совокупности теории нормального распределения38. Для этого составим таблицу распределения данных (таблица )
-
Диапазон
| Кол-во элементов
| Середина интервала
| Сумма
| От 5 до 10
| 1
| 7,5
| 5
| От 10 до 15
| 5
| 12,5
| 50
| От 15 до 20
| 2
| 17,5
| 30
| От 20 до 25
| 3
| 22,5
| 60
| От 25 до 30
| 1
| 27,5
| 25
| Всего
| 12
|
| 170
|
И построим кривую распределения (см. график).
Можно увидеть, что распределение данных не соответствует «стандартной картинке» нормального распределения. Из чего должен быть сделан вывод о том, что применение выборочного статистического исследования к этой совокупности нецелесообразно.
К этой совокупности могут быть применены методы нестатистического выборочного исследования, а при целесообразности - метод сплошной проверки.
Excel содержит функцию анализа соответствия данных закону нормального распределения. Крупные аудиторские компании используют аудиторские программы, позволяющие автоматизировать выборочные исследования.
Если совокупность отвечает закону нормального распределения определяется объем выборки и методы отбора элементов в выборку.
Определение объема выборки
С понятием статистического метода исследования связано понятие репрезентативности выборки.
Репрезентативная (представительная) выборка – выборка, элементы которой обладают характеристиками, типичными для проверяемой совокупности («репрезентативный» (от франц. representatif) – «показательный, типичный для группы или класса»). Требование репрезентативности предполагает, что все элементы проверяемой совокупности должны иметь равную вероятность быть отобранными в выборку.
Однако, на репрезентативность влияет не только способ отбора, но и объем выборки. Приведем простой пример. Если мы заходим выборочным путем определить облик жителей страны (пол, рост, вес и т.д.), и выберем одного любого встречного на улице человека – отбор будет случайным, но не представительным. Даже если выберем двух человек – репрезентативной выборки мы не получим.
В статистике объем выборки находят умножением стоимостной величины генеральной совокупности (В) на фактор уверенности (ФУ) и делением на допустимую ошибку (ДО):
Объем выборки = В*ФУ/ДО
Стоимостная величина генеральной совокупности (В) – это общая стоимость тестируемых элементов генеральной совокупности или подсовокупности (страты). Фактор уверенности берется из таблицы:
Уровень уверенности (%)
| 80,0
| 90,0
| 95,0
| 97,5
| 99,0
| 99,5
| Фактор уверенности (ФУ)
| 1,61
| 2,31
| 3,0
| 3,69
| 4,61
| 5,30
|
Допустимая ошибка (ДО) – равна или меньше запланированного уровня существенности. Иллюстрация. Стоимостной объем генеральной совокупности составляет 3 530 000 рублей. Уровень существенности 70 000 рублей. Аудитор хочет быть на 80% быть уверен, что обнаружит искажения в генеральной совокупности, превышающие уровень существенности. Объем выборки будет равен:
Методы отбора элементов в выборку
В статистических выборках используется случайный отбор или систематический отбор. Случайный отбор. Для случайного отбора используется генератор случайных чисел (как программный продукт в электронно-вычислительной технике) или таблицы случайных чисел.
Excel содержит функцию генерации случайных чисел от 0 до 1. Иллюстрация. Показатель выручки составляют 2560 операций на общую сумму 21 345 600 рублей. Случайное число: 0,34567.
При немонетарной выборке проверке подлежит операции по списку № 885 (2560 умножить на 0,34567).
Если строится монетарная выборка, то проверяется операция после совершения которой совокупная сумма реализации «перевалила» за 7 37 533 рубля (21 345 600 умножить на 0,34567).
И так далее, генерируется столько случайных чисел, сколько нужно отобрать элементов. Существует проблема повтора, поэтому различают бесповторные и повторные выборки. Это важно! Не путайте случайный и бессистемный отбор. Если аудитор открыл документ в папке наугад – это бессистемный отбор. Случайный отбор – это отбор с использованием генератора случайных чисел. Систематический отбор. Для систематического отбора число элементов в генеральной совокупности делится на объем отобранной совокупности так, чтобы обеспечить интервал выборки (например, равный 50), и после определения исходной точки в пределах первых 50 элементов затем отбирается каждый 50-й элемент выборки.
Отобранная совокупность носит более случайный характер, если исходная точка определяется путем использования генератора случайных чисел в компьютере или таблиц случайных чисел. Иллюстрация. Показатель выручки составляют 2560 операций на общую сумму 21 345 600 рублей. Надо отобрать 32 элемента для проверки.
Немонетарная выборка. Определяем шаг интервала: 2560 делим на 32 получаем 80 –это шаг интервала.
На первом интервале определяем начальную точку. Если случайное число 0,24567, то начальная точка 20 (80 умножаем на случайное число).
Тогда проверке подлежат операции (номер по списку): 20,100, 180, 260 и т.д.
Монетарная выборка. Определяем шаг интервала: 21 345 600 рублей делим на 32 получаем 667 050 –это шаг интервала.
На первом интервале определяем начальную точку. Если случайное число 0,24567, то начальная точка 163 874 (667 050 умножаем на случайное число).
Тогда проверке подлежат операции, после совершения которых совокупный (нарастающий) итог проверяемых операций «перевалил» сумму 163 874, 830 834 (начальная точка плюс шаг интервала), 1 497 884 и т.д.
|