Запорожец  Издания 

0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 [ 53 ] 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95

Поскольку при справедливости гипотезы для однородной независимой выборки значение ранга какого-либо элемента выборки Xi равновероятно (отсчеты хну равномерно перемешаны в вариационном ряду), каково бы ни было распределение G (х), тест, основанный на любой ранговой статистике S(R) (функции от рангового вектора R=(i?,, R2,..., Rn), оказывается непараметрическим. Более строгое доказательство непараметричности дано в § 8.3.

Когда справедлива альтернатива F(x)<.G(x), в частности альтернатива сдвига f (л;) = G (л;-а), отсчеты х будут располагаться преимущественно в правой части ряда, т. е. значения их рангов будут статистически большими, чем при справедливости гипотезы. Эти различия в значениях рангов служат мерой, характеризующей степень различения (контраст) между опорной и исследуемой выборками.

Укажем на одно замечательное свойство ранговых статистик - инвариантность их относительно нелинейных монотонных преобразований. Действительно, любое преобразование указанного типа не нарушает соотношения между отсчетами (порядок расположения отсчетов в вариационном ряду), а значит, их ранги. Поэтому мощность теста (вероятность правильного обнаружения D) и его значимость (вероятность ложного обнаружения а) остаются такими же, как и до преобразования.

Переход от выборочных значений д; к их рангам приводит к потере части информации. Однако при увеличении объема наблюдений растет статистическая связь между х и Rj, эти потери уменьшаются, и ранговые алгоритмы могут оказаться столь же эффективными, как и основанные на выборочных значениях.

Одним из наиболее распространенных ранговых тестов является тест Вилкоксона, основанный на статистике, определяемой суммой рангов (41]. Тест может быть использован, например, для проверки гипотезы Но симметрии распределения случайной величины X относительно нуля (задача обнаружения постоянного сигнала на фоне аддитивной помехи с нулевым средним и симметричным распределением). Гипотеза Но отвергается (выносится решение о наличии сигнала), если

5= 2 Rt= iRfh{x,)>C, (8.12)

где Ri+ - ранг положительного элемента Xf в вариационном ряду, составленном из абсолютных значений независимых измерений Xi, Х2,..., Хп] h (х) - функция единичного скачка; С - порог, определяемый заданной вероятностью аь Тест (8.12) использует значения рангов только положительных отсчетов (Xi>0). В связи с этим его и ему подобные тесты иногда называют знаково-ранго-выми.

Если параметры распределения G(x) или вид его неизвестны, а известно лишь, например, что F{x) = G{x-a), a=const (альтерна-



1пва сдвига), то приходим к двухвыборочному алгоритму Вилкок-.она (Манна - Уитни)

S= Б RiC, (8.13)

де 7?г -ранг отсчета Xi в вариационном ряду, составленном из независимых отсчетов опорной выборки уи уг,..., f/n и п независимых отсчетов Хи Х2,..., Хп исследуемой.

Тест Вилкоксона хорошо работает и в более широком классе альтернатив, обобщающих альтернативу сдвига: F{x)<.G{x);

F{x)G>(x), k>0; Р(х>у)>, kF{x)-=G{x), k>0 и др.

Несколько большую эффективность (мощность), чем тест Вилкоксона при нормальной альтернативе сдвига F(x) = G{x-а), дает тест Ван-дер-Вардена, статистика которого

S= S ф-( ), (8.14)

(8.15)

или в двухвыборочном варианте

S= 2Ф- f--

iZi \ т + п+ 1

где Ф~Ч") - функция, обратная функции нормального распределения.

Возможны случаи, когда альтернативное распределение зависит от номера наблюдений i{F{x)=Fi{x), t=l, n). Это может иметь место, если ведется обнаружение детерминированного сигнала, который изменяется па интервале наблюдений. Тогда при альтернативе сдвига Ft(x) = G(x-Хщ), Я:?»0 задача обнаружения формулируется в виде проверки гипотезы Яо: к=0, против альтернативы Яь Я>0 и является обобщением рассмотренной выше задачи, в которой предполагалось Ui=a,

Статистики знакового и ранговых тестов Вилкоксона и Ван-дер-Вардена запишутся в виде

£-1 £=1 \ fi + 1 /

(8.16)

или в двухвыборочном варианте

SZUih (Xi - уг); i=i

5=2S=iutO~4 , V (8.17)

£=1 £=i \ m + n+l )

Для проверки гипотезы F{x) = G(x) при альтернативе масштаба

F(x) = G - (а - параметр масштаба) применяются тесты, ста-

6* 163



тистики которых являются квадратичными функциями рангов. Таковы статистики соответственно Муда и Клотца

i=l I 2 J 1 }

(8.18)

При альтернативе F(x) = G{x), а также при альтернативе сдвига хорошо работает тест Сэвиджа, использующий статистику

п т-\-п 1

5=2 2 -- (8-19)

Известные тесты (знаковый, Вилкоксона, Ван-дер-Вардена и др.), получены эвристическим путем. Синтез оптимальных ранговых алгоритмов при конечных размерах выборки, которые имеют место на практике, наталкивается на значительные математиче-<;кие трудности. В § 8.2, 8.4 и 9.2 приведены результаты синтеза оптимальных непараметрических (знаковых и ранговых) обнаружителей Неймана - Пирсона и Вальда для модифицированного способа формирования рангов (используемого в алгоритмах обнаружения сигнала), когда опорная выборка обновляется для каждого i-ro наблюдения. Подчеркнем, что речь идет об алгоритмах, оптимальных в классе ранговых. При выборках конечного объема невозможно построение абсолютно оптимального рангового обнаружителя (РО). Это следует из того, что при переходе от выборочных значений к рангам часть информации теряется.

Решить задачу синтеза оптимальных ранговых алгоритмов проще в асимптотическом случае, т. е. при бесконечно большом числе наблюдений, что соответствует случаю обнаружения бесконечно слабого сигнала. С ростом числа наблюдений растет статистическая связь между отсчетами и их рангами, поэтому асимптотически оптимальные ранговые алгоритмы могут оказаться асимптотически оптимальными вообще.

Универсальным ранговым тестом при альтернативе сдвига является адаптивный тест Гаека [1], асимптотически наиболее мощный независимо от вида F(x) не только в классе ранговых, но и произвольных тестов, построенных по известным распределениям. Известно также асимптотически оптимальное ранговое правило обнаружения детерминированного сигнала на фоне аддитивной стационарной помехи, предложенное Б. Р. Левиным и А. Ф. Кушни-ром [1]. Применение этих тестов тормозится на практике тем, что они являются чрезвычайно громоздкими в вычислительном отношении, скорость сходимости мощности к максимально возможной низка и неизвестно поведение тестов (их мощность) для выборок конечного (малого) объема.

Гаек Я., Шидак 3. Теория ранговых критериев: Пер. с немецк./Под ред. Н. В. Смирнова. -М.: ИЛ, I960. -434 с.



0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 [ 53 ] 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95