Эмпирическая
функция распределения
Чтобы от отдельных событий перейти к одновременному
рассмотрению многих событий, используют накопленную частоту. Так называется
отношение числа единиц, для которых результаты наблюдения меньше заданного
значения, к общему числу наблюдений. (Это понятие используется, если результаты
наблюдения – действительные числа, а не вектора, функции или объекты нечисловой
природы.) Функция, которая выражает зависимость между значениями
количественного признака и накопленной частотой, называется эмпирической
функцией распределения. Итак, эмпирической функцией распределения Fn(x) называется доля элементов выборки, меньших x. Эмпирическая функция распределения
содержит всю информацию о результатах наблюдений.
Чтобы
записать выражение для эмпирической функции распределения в виде формулы,
введем функцию с(х, у) двух переменных:

Случайные величины, моделирующие
результаты наблюдений, обозначим
. Тогда
эмпирическая функция распределения Fn(x) имеет вид

Из
закона больших чисел следует, что для каждого действительного числа х эмпирическая функция распределения Fn(x) сходится к функции распределения F(x) результатов наблюдений, т.е.
Fn(x) → F(x) (1)
при n → ∞. Советский математик
В.И. Гливенко (1897-1940) доказал в
1933 г. более сильное утверждение: сходимость в
(1) равномерна по х, т.е.
(2)
при n → ∞ (сходимость по вероятности).
В
(2) использовано обозначение sup (читается как «супремум»). Для функции g(x) под
понимают наименьшее из чисел a таких, что g(x)<a при всех x. Если функция g(x) достигает максимума в точке х0, то
. В таком
случае вместо sup пишут max. Хорошо известно, что не все функции достигают максимума.
В
том же
1933 г.
А.Н.Колмогоров усилил результат В.И. Гливенко для непрерывных функций
распределения F(x). Рассмотрим случайную величину

и ее функцию распределения

По теореме А.Н.Колмогорова

при каждом х, где К(х) – т.н. функция
распределения Колмогорова.
Рассматриваемая
работа А.Н. Колмогорова породила одно из основных направлений математической
статистики – т.н. непараметрическую статистику. И в настоящее время
непараметрические критерии согласия Колмогорова, Смирнова, омега-квадрат широко
используются. Они были разработаны для проверки согласия с полностью
известным теоретическим распределением, т.е. предназначены для проверки
гипотезы
.
Основная идея критериев Колмогорова, омега-квадрат и аналогичных им состоит в
измерении расстояния между функцией эмпирического распределения и функцией
теоретического распределения. Различаются эти критерии видом расстояний в
пространстве функций распределения. Аналитические выражения для предельных
распределений статистик, расчетные формулы, таблицы распределений и критических
значений широко распространены [8], поэтому не будем их приводить.