Z -test - Z-test

Hipoteza zerowa-reigon-pol.png

Z -test jakikolwiek testy statystyczne , dla którego dystrybucja na statystykę testową pod hipotezy zerowej może być aproksymowane za pomocą rozkładu normalnego . Testy Z testują średnią rozkładu. Na każdym poziomie istotności w przedziale ufności , The Z -test ma jeden krytycznej wartości (na przykład 1,96 do 5% przynajmniej dwa rozkładem), co sprawia, że jest bardziej wygodny niż Studenta t -test którego krytyczne wartości są określone przez wielkość próbki ( przez odpowiednie stopnie swobody ).

Zastosowanie

Ze względu na centralne twierdzenie graniczne , wiele statystyk testowych ma w przybliżeniu rozkład normalny dla dużych próbek. Dlatego też wiele testów statystycznych można wygodnie przeprowadzić jako przybliżone testy Z, jeśli wielkość próby jest duża lub znana jest wariancja populacji. Jeśli wariancja populacji jest nieznana (i dlatego musi być oszacowana na podstawie samej próbki), a wielkość próby nie jest duża ( n < 30), bardziej odpowiedni może być test t- Studenta.

Procedura

Jak wykonać test Z, gdy T jest statystyką, która ma w przybliżeniu rozkład normalny w ramach hipotezy zerowej, wygląda następująco:

Najpierw oszacowania wartości oczekiwanej ľ z T zgodnie z hipotezą zerową, i uzyskać oszacowanie s z odchylenia standardowego z T .

Po drugie, określ właściwości T  : jednoogonowy lub dwuogonowy.

Dla hipotezy zerowej H 0 : μ≥μ 0 vs hipotezy alternatywnej H 1 : μ<μ 0 , jest ona niższa/lewostronna (jednostronna).

Dla hipotezy zerowej H 0 : μ≤μ 0 vs hipotezy alternatywnej H 1 : μ>μ 0 , jest ona górna/prawostronna (jednostronna).

Dla hipotezy zerowej H 0 : μ=μ 0 vs hipotezy alternatywnej H 1 : μ≠μ 0 , jest ona dwustronna.

Po trzecie, oblicz standardowy wynik  :

,

którym jednostronny i dwustronny p -values można obliczyć cp ( Z ) (dla mniejszych / lewo rozkładem testach) - cp ( Z ) (dla górnej / prawo-stronne testów) i 2Φ (- | Z | ) (dla testów dwustronnych), gdzie Φ jest standardową funkcją skumulowanego rozkładu normalnego .

Użyj w testowaniu lokalizacji

  1. Termin „ test Z ” jest często używany w odniesieniu do testu lokalizacji jednej próbki, porównującego średnią zestawu pomiarów z daną stałą, gdy znana jest wariancja próbki. Na przykład, jeśli obserwowane dane X 1 , ..., X n są (i) niezależne, (ii) mają wspólną średnią μ i (iii) mają wspólną wariancję σ 2 , to średnia próbki X ma średnią μ i wariancji .
  2. Hipoteza zerowa mówi, że średnia wartość X to dana liczba μ 0 . Możemy użyć X   jako statystyki testowej, odrzucając hipotezę zerową, jeśli X  − μ 0 jest duże.
  3. Aby obliczyć statystykę standaryzowaną , musimy albo znać, albo mieć przybliżoną wartość σ 2 , z której możemy obliczyć . W niektórych aplikacjach znane jest σ 2 , ale jest to rzadkie.
  4. Jeśli wielkość próbki jest umiarkowana lub duża, możemy zastąpić wariancję próbki σ 2 , dając test wtyczki . Wynikowy test nie będzie dokładnym testem Z, ponieważ nie uwzględnia się niepewności w wariancji próbki – jednak będzie to dobre przybliżenie, chyba że wielkość próbki jest mała.
  5. T -test może być stosowany w celu uwzględnienia niepewności w wariancji próbki, gdy dane są dokładnie normalne .
  6. Różnica między testem Z a testem t: Test Z jest używany, gdy wielkość próby jest duża (n>50) lub znana jest wariancja populacji. Test t jest stosowany, gdy wielkość próby jest mała (n<50) i wariancja populacji jest nieznana.
  7. Nie ma uniwersalnej stałej, przy której wielkość próbki jest ogólnie uważana za wystarczająco dużą, aby uzasadnić użycie testu wtyczek. Typowe zasady kciuka: wielkość próby powinna wynosić 50 obserwacji lub więcej.
  8. W przypadku dużych próbek procedura testu t daje prawie identyczne wartości p jak procedura testu Z.
  9. Inne testy lokalizacji, które można wykonać jako testy Z, to test lokalizacji dla dwóch prób i test różnicy par .

Warunki

Aby test Z miał zastosowanie, muszą być spełnione określone warunki.

  • Parametry uciążliwości powinny być znane lub oszacowane z dużą dokładnością (przykładem parametru uciążliwego byłoby odchylenie standardowe w teście lokalizacji jednej próbki). Testy Z skupiają się na pojedynczym parametrze i traktują wszystkie inne nieznane parametry jako ustalone na ich prawdziwych wartościach. W praktyce, ze względu na twierdzenie Słuckiego , "podpięcie" spójnych oszacowań uciążliwych parametrów może być uzasadnione. Jeśli jednak wielkość próbki nie jest wystarczająco duża, aby te szacunki były dość dokładne, test Z może nie działać dobrze.
  • Statystyka testowa powinna mieć rozkład normalny . Ogólnie rzecz biorąc, odwołuje się do centralnego twierdzenia granicznego, aby uzasadnić założenie, że statystyka testowa zmienia się normalnie. Istnieje wiele badań statystycznych dotyczących tego, kiedy statystyki testowe różnią się w przybliżeniu normalnie. Jeśli zmienność statystyki testowej jest silnie odbiegająca od normy, nie należy stosować testu Z.

Jeśli połączono oszacowania uciążliwych parametrów, jak omówiono powyżej, ważne jest, aby użyć oszacowań odpowiednich do sposobu, w jaki dane zostały pobrane . W szczególnym przypadku testów Z dla problemu lokalizacji jednej lub dwóch próbek, zwykłe odchylenie standardowe próbki jest odpowiednie tylko wtedy, gdy dane zostały zebrane jako próbka niezależna.

W niektórych sytuacjach możliwe jest zaprojektowanie testu, który prawidłowo uwzględnia zmienność szacunków wtyczek dotyczących uciążliwych parametrów. W przypadku jednego i dwóch problemów z lokalizacją próbki, wykonuje to test t .

Przykład

Załóżmy, że w określonym regionie geograficznym średnia i odchylenie standardowe wyników testu czytania wynoszą odpowiednio 100 i 12 punktów. Interesuje nas wynik 55 uczniów w danej szkole, którzy uzyskali średni wynik 96. Możemy zapytać, czy ten średni wynik jest znacząco niższy niż średnia regionalna, czyli czy uczniowie tej szkoły są porównywalni do zwykłego losowego próba 55 uczniów z całego regionu, czy też ich wyniki są zaskakująco niskie?

Najpierw oblicz błąd standardowy średniej:

gdzie jest odchylenie standardowe populacji.

Następnie oblicz z -score , czyli odległość od średniej próbki do średniej populacji w jednostkach błędu standardowego:

W tym przykładzie traktujemy średnią populacji i wariancję jako znane, co byłoby właściwe, gdyby przetestowano wszystkich uczniów w regionie. Gdy parametry populacji są nieznane, należy zamiast tego przeprowadzić test t-Studenta .

Średnia ocena w klasie wynosi 96, co stanowi -2,47 jednostki błędu standardowego ze średniej populacji wynoszącej 100. Patrząc na wynik z w tabeli skumulowanego prawdopodobieństwa standardowego rozkładu normalnego , stwierdzamy, że prawdopodobieństwo zaobserwowania standardowej wartości normalnej poniżej -2,47 to około 0,5-0,4932 = 0,0068. Jest to jednostronna wartość p dla hipotezy zerowej, że 55 uczniów jest porównywalnych z prostą próbą losową z populacji wszystkich zdających. Dwustronna wartość p wynosi w przybliżeniu 0,014 (dwukrotność jednostronnej wartości p ).

Innym sposobem stwierdzenia jest to, że z prawdopodobieństwem 1 − 0,014 = 0,986, prosta losowa próba 55 uczniów miałaby średni wynik testu w granicach 4 jednostek średniej populacji. Można również powiedzieć, że z 98,6% pewnością odrzucamy hipotezę zerową, że 55 osób jest porównywalnych z prostą próbą losową z populacji osób testujących.

Test Z mówi nam, że 55 uczniów będących przedmiotem zainteresowania ma niezwykle niski średni wynik testu w porównaniu z większością prostych prób losowych o podobnej wielkości z populacji zdających. Wadą tej analizy jest to, że nie bierze pod uwagę, czy wielkość efektu wynosząca 4 punkty jest znacząca. Jeśli zamiast klasy wzięlibyśmy pod uwagę podregion obejmujący 900 uczniów, których średni wynik wyniósł 99, zaobserwowano by prawie takie same z -score i p -value. Pokazuje to, że jeśli wielkość próby jest wystarczająco duża, bardzo małe różnice od wartości zerowej mogą być wysoce istotne statystycznie. Zobacz testowanie hipotez statystycznych w celu dalszej dyskusji na ten temat.

Z -testy inne niż testy lokalizacyjne

Testy lokalizacyjne są najbardziej znanymi testami Z. Inna klasa Z- testów powstaje w estymacji parametrów z maksymalnym prawdopodobieństwem w parametrycznym modelu statystycznym . Szacunki maksymalnego prawdopodobieństwa są w przybliżeniu normalne w pewnych warunkach, a ich asymptotyczną wariancję można obliczyć na podstawie informacji Fishera. Oszacowanie największego prawdopodobieństwa podzielone przez jego błąd standardowy można wykorzystać jako statystykę testową dla hipotezy zerowej, że populacyjna wartość parametru jest równa zeru. Bardziej ogólnie, jeśli jest to oszacowanie największego prawdopodobieństwa parametru θ, a θ 0 jest wartością θ przy hipotezie zerowej,

może być używany jako statystyka testu Z.

Używając testu Z do oszacowania największej prawdopodobieństwa, należy mieć świadomość, że normalne przybliżenie może być słabe, jeśli wielkość próbki nie jest wystarczająco duża. Chociaż nie ma prostej, uniwersalnej zasady określającej, jak duży musi być rozmiar próbki, aby użyć testu Z , symulacja może dać dobre wyobrażenie, czy test Z jest odpowiedni w danej sytuacji.

Testy Z są stosowane wszędzie tam, gdzie można argumentować, że statystyka testowa ma rozkład normalny zgodnie z interesującą hipotezą zerową. Wiele statystyk testów nieparametrycznych , takich jak statystyki U , jest w przybliżeniu normalnych dla wystarczająco dużych próbek, a zatem są często wykonywane jako testy Z.

Zobacz też

Bibliografia

  • Sprinthall, RC (2011). Podstawowa analiza statystyczna (wyd. 9). Edukacja Pearsona. Numer ISBN 978-0-205-05217-2.
  • Casella, G. , Berger, RL (2002). Wnioskowanie statystyczne . Prasa Duxbury. ISBN  0-534-24312-6 .
  • Douglas C.Montgomery, George C.Runger.(2014). Stosowane statystyki i prawdopodobieństwo dla inżynierów .(6th ed.). John Wiley & Sons, Inc. ISBN  9781118539712 , 9781118645062 .