Jednolicie najsilniejszy test - Uniformly most powerful test

W testowaniu hipotez statystycznych , jednolicie najsilniejszy test ( UMP ) jest testem hipotezy, który ma największą moc spośród wszystkich możliwych testów o danej wielkości α . Na przykład, zgodnie z lematem Neymana-Pearsona , test współczynnika wiarygodności to UMP do testowania prostych (punktowych) hipotez.

Oprawa

Niech oznaczają wektor losowej (odpowiadający pomiarów) pochodzącą z parametryzowaną rodziny od funkcji gęstości prawdopodobieństwa lub funkcji masy prawdopodobieństwa , który zależy od nieznanego parametru deterministyczny . Przestrzeń parametrów jest podzielona na dwa rozłączne zestawy i . Niech oznaczają hipotezę, że i niech oznaczają hipotezę, że . Binarny test hipotez jest wykonywany za pomocą funkcji testowej .

co oznacza, że obowiązuje w przypadku pomiaru i to w przypadku pomiaru . Zauważ, że jest to rozłączne pokrycie przestrzeni pomiarowej.

Definicja formalna

Funkcja testowa ma rozmiar UMP, jeśli dla jakiejkolwiek innej funkcji testowej jest zadowalająca

mamy

Twierdzenie Karlina-Rubina

Twierdzenie Karlina – Rubina można traktować jako rozszerzenie lematu Neymana – Pearsona dla hipotez złożonych. Rozważmy pomiar skalarny z funkcją gęstości prawdopodobieństwa sparametryzowaną parametrem skalarnym θ i zdefiniuj współczynnik wiarygodności . Jeśli jest monotoniczny, nie malejący, in dla dowolnej pary (co oznacza, że ​​im większe , tym bardziej prawdopodobne ), to test progowy:

gdzie jest taki wybrany

to test UMP o rozmiarze α do testowania

Zauważ, że dokładnie tym samym testem jest również UMP do testowania

Ważny przypadek: rodzina wykładnicza

Chociaż twierdzenie Karlina-Rubina może wydawać się słabe ze względu na jego ograniczenie do parametru skalarnego i pomiaru skalarnego, okazuje się, że istnieje wiele problemów, dla których twierdzenie to ma zastosowanie. W szczególności, jednowymiarowy wykładniczy rodziny od funkcji gęstości prawdopodobieństwa lub funkcji masy prawdopodobieństwa z

ma monotoniczny, nie malejący współczynnik prawdopodobieństwa w statystykach wystarczających , pod warunkiem, że nie zmniejsza się.

Przykład

Niech oznaczają IID zwykle rozmieszczone wymiarową losowych wektorów ze średnią i macierz kowariancji . Mamy wtedy

który ma dokładnie postać wykładniczej rodziny pokazanej w poprzedniej sekcji, z wystarczającym bytem statystycznym

W związku z tym dochodzimy do wniosku, że test

to test UMP rozmiaru do testowania vs.

Dalsza dyskusja

Na koniec zauważamy, że generalnie testy UMP nie istnieją dla parametrów wektorów ani dla testów dwustronnych (test, w którym jedna hipoteza leży po obu stronach alternatywy). Powodem jest to, że w takich sytuacjach, najbardziej wydajne test danej wielkości dla jednego z możliwych wartości parametru (na przykład dla gdzie ) różni się od najbardziej mocny próbie tej samej wielkości dla różnych wartości parametru (na przykład dla gdzie ). W rezultacie żaden test nie jest jednakowo najsilniejszy w takich sytuacjach.

Bibliografia

Dalsza lektura

  • Ferguson, TS (1967). Rozdział 5.2: Jednolicie najsilniejsze testy . Statystyka matematyczna: podejście oparte na teorii decyzji . Nowy Jork: Academic Press.
  • Mood, AM; Graybill, FA; Boes, DC (1974). „Rozdział IX.3.2: Jednolite najsilniejsze testy ”. Wprowadzenie do teorii statystyki (wyd. 3). Nowy Jork: McGraw-Hill.
  • LL Scharf, Statistical Signal Processing , Addison-Wesley, 1991, sekcja 4.7.