Непараметрические методы

Определение «Непараметрические методы» по БСЭ:
Непараметрические методы - в математической статистике, методы непосредственной оценки теоретического распределения вероятностей и тех или иных его общих свойств (симметрии и т.п.) по результатам наблюдений. Название Н. м. подчёркивает их отличие от классических (параметрических) методов, в которых предполагается, что неизвестное теоретическое распределение принадлежит какому-либо семейству, зависящему от конечного числа параметров (например, семейству нормальных распределений), и которые позволяют по результатам наблюдений оценивать неизвестные значения этих параметров и проверять те или иные гипотезы относительно их значений. Разработка Н. м. является в значительной степени заслугой советских учёных.
В качестве примера Н. м. можно привести найденный А. Н. Колмогоровым способ проверки согласованности теоретических и эмпирических распределений (так называемый критерий Колмогорова). Пусть результаты n независимых наблюдений некоторой величины имеют функцию распределения F (x) и пусть F_n (x) обозначает эмпирическую функцию распределения (см. Вариационный ряд), построенную по этим n наблюдениям, a D_n - наибольшее по абсолютной величине значение разности F_n(x)−F(x). Случайная величина
√n D_n
имеет в случае непрерывности F(x) функцию распределения K_n(λ), не зависящую от F(x) и стремящуюся при безграничном возрастании n к пределу

K)λ) =
∞
∑
j=−∞
(−1)^je^−jІλІ.

Отсюда при достаточно больших n, для вероятности p_n,λ неравенства
√n D_n ≥ λ
получается приближённое выражение
p_n,λ ≈ 1 − К (λ). (*)
Функция K(λ) табулирована. Её значения для некоторых λ приведены в табл.

Таблица функции K(λ)

λ 0,57 0,71 0,83 1,02 1,36 1,63
K(λ) 0,10 0,30 0,50 0,75 0,95 0,99

Равенство (*) следующим образом используется для проверки гипотезы о том, что наблюдаемая случайная величина имеет функцию распределения F(x): сначала по результатам наблюдений находят значение величины D_n, а затем по формуле (*) вычисляют вероятность получения отклонения F_n от F, большего или равного наблюдённому. Если указанная вероятность достаточно мала, то в соответствии с общими принципами проверки статистических гипотез (см. Статистическая проверка гипотез) проверяемую гипотезу отвергают. В противном случае считают, что результаты опыта не противоречат проверяемой гипотезе. Аналогично проверяется гипотеза о том, получены ли две независимые выборки, объёма n₁ и n₂ соответственно, из одной и той же генеральной совокупности с непрерывным законом распределения. При этом вместо формулы (*) пользуются тем, что вероятность неравенства

D_n₁,n₂
√
n₁n₂

n₁+n₂
< λ ,

как это было установлено Н. В. Смирновым, имеет пределом K (λ), здесь D_n1, _n2 есть наибольшее по абсолютной величине значение разности F_n1(x)−F_n2(х).
Другим примером Н. м. могут служить методы проверки гипотезы о том, что теоретическое распределение принадлежит к семейству нормальных распределений. Отметим здесь лишь один из этих методов - так называемый метод выпрямленной диаграммы. Этот метод основывается на следующем замечании. Если случайная величина X имеет нормальное распределение с параметрами α и σ, то

Φ⁻¹[F(x)] =
x−α

σ
,

где Φ⁻¹ - функция, обратная нормальной:

Φ(x) =
1

√(2π)
x
∫
−∞
e^−uІ/2 du .

Т. о., график функции y = Φ⁻¹[F(x)] будет в этом случае прямой линией, а график функции y = Φ⁻¹[F_n(x)] - ломаной линией, близкой к этой прямой (см. рис.). Степень близости и служит критерием для проверки гипотезы нормальности распределения F (x).
Лит.: Смирнов Н. В., Дунин-Барковский И. В., Курс теории вероятностей и математической статистики для технических приложений, 3 изд., М., 1969; Большев Л. Н., Смирнов Н. В., Таблицы математической статистики, М., 1968.
Ю. В. Прохоров.
Рис. к ст. Непараметрические методы.

Неоэндемики Непараметрические методы Непарнопалые