Статистика - простая случайная выборка

Простая случайная выборка определяется как такая, в которой каждый элемент совокупности имеет равные и независимые шансы быть выбранным. В случае совокупности с N единицами вероятность выбора n единиц выборки со всеми возможными комбинациями N C n выборок определяется как 1 / N C n, например, если у нас есть популяция из пяти элементов (A, B, C, D, E), то есть N 5, и нам нужна выборка размером n = 3, тогда имеется 5 C 3 = 10 возможных выборок, и вероятность того, что любая отдельная единица будет членом выборки, равна 1/10.

Простая случайная выборка может быть сделана двумя разными способами, то есть «с заменой» или «без замены». Когда единицы выбираются в выборку последовательно после замены выбранной единицы перед следующим розыгрышем, это простая случайная выборка с заменой. Если отобранные единицы не заменяются до следующего розыгрыша, а отбор последовательных единиц производится только из оставшихся единиц совокупности, то это называется простой случайной выборкой без замены. Таким образом, в первом методе один раз выбранный блок может повторяться, тогда как во втором один раз выбранный блок не повторяется. Из-за большей статистической эффективности, связанной с простой случайной выборкой без замены, это предпочтительный метод.

Простая случайная выборка может быть взята с помощью любой из двух процедур, то есть методом лотереи или с помощью таблиц случайных чисел.

  • Lottery Method- По этому методу юниты выбираются на основе случайных розыгрышей. Сначала каждому члену или элементу населения присваивается уникальный номер. На следующем этапе эти числа записываются на отдельные карточки, которые физически похожи по форме, размеру, цвету и т.д. Затем они помещаются в корзину и тщательно перемешиваются. На последнем этапе листы случайным образом вынимаются, не глядя на них. Количество выписанных бланков соответствует требуемому размеру выборки.

    Метод лотереи имеет несколько недостатков. Процесс написания N бюллетеней является обременительным, а перетасовка большого количества листовок при очень большом размере популяции затруднена. Также при выборе листовок может присутствовать человеческий фактор. Следовательно, можно использовать другую альтернативу, т.е. случайные числа.

  • Random Number Tables Method- Они состоят из столбцов чисел, которые были подготовлены случайным образом. Доступно количество случайных таблиц, например таблицы Фишера и Йейтса, типовые случайные числа и т. Д. Ниже приведена последовательность двухзначных случайных чисел из таблицы Фишера и Йейтса:

    61, 44, 65, 22, 01, 67, 76, 23, 57, 58, 54, 11, 33, 86, 07, 26, 75, 76, 64, 22, 19, 35, 74, 49, 86, 58, 69, 52, 27, 34, 91, 25, 34, 67, 76, 73, 27, 16, 53, 18, 19, 69, 32, 52, 38, 72, 38, 64, 81, 79 и 38.

    Первый шаг включает присвоение уникального номера каждому члену популяции, например, если популяция состоит из 20 человек, то все люди пронумерованы от 01 до 20. Если мы собираемся собрать выборку из 5 единиц, то обращаемся к таблицам случайных чисел 5 выбираются двузначные числа. Например, используя приведенную выше таблицу, единицы, имеющие следующие пять номеров, сформируют выборку: 01, 11, 07, 19 и 16. Если выборка без замены и конкретное случайное число повторяется, то оно не будет повторяться и следующее будет выбран номер, соответствующий нашим критериям.

Таким образом, простая случайная выборка может быть составлена ​​с использованием любой из двух процедур. Однако на практике было замечено, что простая случайная выборка требует много времени и усилий и непрактична.