Гипергеометрическое
распределение
Гипергеометрическое
распределение имеет место при выборочном контроле конечной совокупности
объектов объема N по альтернативному признаку. Каждый контролируемый объект
классифицируется либо как обладающий признаком А, либо как не обладающий
этим признаком. Гипергеометрическое распределение имеет случайная величина Y, равная числу объектов, обладающих
признаком А в случайной выборке объема n, где n<N. Например, число Y дефектных единиц продукции в
случайной выборке объема n из партии объема N имеет гипергеометрическое
распределение, если n<N. Другой пример – лотерея. Пусть признак А билета – это признак «быть выигрышным». Пусть всего билетов N, а некоторое лицо приобрело n из них. Тогда число выигрышных
билетов у этого лица имеет гипергеометрическое распределение.
Для
гипергеометрического распределения вероятность принятия случайной величиной Y значения y имеет вид
(20)
где D – число объектов, обладающих
признаком А, в рассматриваемой совокупности объема N. При этом y принимает значения от max{0, n - (N - D)} до min{n, D}, при прочих y вероятность в формуле (20) равна 0.
Таким образом, гипергеометрическое распределение определяется тремя параметрами
– объемом генеральной совокупности N, числом объектов D в ней, обладающих рассматриваемым
признаком А, и объемом выборки n.
Простой
случайной выборкой объема n из совокупности объема N называется выборка, полученная в
результате случайного отбора, при котором любой из наборов из n объектов имеет одну и ту же
вероятность быть отобранным. Методы случайного отбора выборок респондентов (опрашиваемых)
или единиц штучной продукции рассматриваются в инструктивно-методических и
нормативно-технических документах. Один из методов отбора таков: объекты
отбирают один из другим, причем на каждом шаге каждый из оставшихся в
совокупности объектов имеет одинаковые шансы быть отобранным. В литературе для
рассматриваемого типа выборок используются также термины «случайная выборка»,
«случайная выборка без возвращения».
Поскольку
объемы генеральной совокупности (партии) N и выборки n обычно известны, то подлежащим
оцениванию параметром гипергеометрического распределения является D. В статистических методах управления
качеством продукции D – обычно число дефектных единиц продукции в партии.
Представляет интерес также характеристика распределения D/N – уровень дефектности.
Для
гипергеометрического распределения
Последний множитель в выражении для
дисперсии близок к 1, если N>10n. Если при этом сделать замену p = D/N, то выражения для математического ожидания и дисперсии
гипергеометрического распределения перейдут в выражения для математического
ожидания и дисперсии биномиального распределения. Это не случайно. Можно
показать, что
при N>10n, где p = D/N. Точнее, справедливо предельное соотношение
и этим предельным соотношением можно
пользоваться при N>10n.