Задачи
одномерной статистики (статистики случайных величин)
Сравнение математических ожиданий
проводят в тех случаях, когда необходимо установить соответствие показателей
качества изготовленной продукции и эталонного образца. Это – задача проверки
гипотезы:
Н0: М(Х) = m0,
где m0 – значение соответствующее эталонному образцу; Х – случайная величина, моделирующая результаты наблюдений. В зависимости от
формулировки вероятностной модели ситуации и альтернативной гипотезы сравнение математических
ожиданий проводят либо параметрическими, либо непараметрическими методами.
Сравнение
дисперсий проводят тогда, когда требуется установить отличие рассеивания
показателя качества от номинального. Для этого проверяют гипотезу:
Ряд
иных постановок задач одномерной статистики приведен ниже. Не меньшее значение,
чем задачи проверки гипотез, имеют задачи оценивания параметров. Они, как и
задачи проверки гипотез, в зависимости от используемой вероятностной модели
ситуации делятся на параметрические и непараметрические.
В
параметрических задачах оценивания принимают вероятностную модель, согласно
которой результаты наблюдений x1, x2,…, xn рассматривают как реализации n независимых случайных величин с
функцией распределения F(x;θ). Здесь θ – неизвестный параметр, лежащий
в пространстве параметров Θ заданном используемой вероятностной моделью.
Задача оценивания состоит в определении точечной оценок и доверительных границ
(либо доверительной области) для параметра θ.
Параметр θ – либо число,
либо вектор фиксированной конечной размерности. Так, для нормального
распределения θ = (m, σ2) – двумерный вектор, для
биномиального θ = p – число, для гамма-распределения θ = (a, b, c) – трехмерный вектор, и т.д.
В
современной математической статистике разработан ряд общих методов определения
оценок и доверительных границ – метод моментов, метод максимального
правдоподобия, метод одношаговых оценок, метод устойчивых (робастных) оценок,
метод несмещенных оценок и др. Кратко рассмотрим первые три из них.
Теоретические основы различных методов оценивания и полученные с их помощью
конкретные правила определения оценок и доверительных границ для тех или иных
параметрических семейств распределений рассмотрены в специальной литературе,
включены в нормативно-техническую и инструктивно-методическую документацию.
Метод
моментов основан на использовании выражений для моментов рассматриваемых
случайных величин через параметры их функций распределения. Оценки метода
моментов получают, подставляя выборочные моменты вместо теоретических в
функции, выражающие параметры через моменты.
В
методе максимального правдоподобия, разработанном в основном Р.А.Фишером, в
качестве оценки параметра θ берут значение θ*, для которого
максимальна так называемая функция правдоподобия
f(x1, θ) f(x2, θ) … f(xn, θ),
где x1, x2,…, xn - результаты наблюдений; f(x, θ) – их плотность распределения,
зависящая от параметра θ, который необходимо оценить.
Оценки
максимального правдоподобия, как правило, эффективны (или асимптотически эффективны)
и имеют меньшую дисперсию, чем оценки метода моментов. В отдельных случаях
формулы для них выписываются явно (нормальное распределение, экспоненциальное
распределение без сдвига). Однако чаще для их нахождения необходимо численно
решать систему трансцендентных уравнений (распределения Вейбулла-Гнеденко,
гамма). В подобных случаях целесообразно использовать не оценки максимального
правдоподобия, а другие виды оценок, прежде всего одношаговые оценки. В
литературе их иногда не вполне точно называют «приближенные оценки
максимального правдоподобия». При достаточно больших объемах выборок они имеют
столь же хорошие свойства, как и оценки максимального правдоподобия. Поэтому их
следует рассматривать не как «приближенные», а как оценки, полученные по другому методу, не менее обоснованному и эффективному, чем метод максимального
правдоподобия. Одношаговые оценки вычисляют по явным формулам ([14]).
В
непараметрических задачах оценивания принимают вероятностную модель, в которой
результаты наблюдений x1, x2,…, xn рассматривают как реализации n независимых случайных величин с
функцией распределения F(x) общего вида. От F(x) требуют лишь выполнения некоторых
условий типа непрерывности, существования математического ожидания и дисперсии
и т.п. Подобные условия не являются столь жесткими, как условие принадлежности
к определенному параметрическому семейству.