Statystyka testowa - Test statistic

Statystyka testowa jest statystyka (ilość pochodzi z próbki ) stosowane w testowanie hipotez statystycznych . Test hipotezy jest zwykle określany w postaci statystyki testowej, traktowanej jako liczbowe podsumowanie zestawu danych, które redukuje dane do jednej wartości, która może być użyta do przeprowadzenia testu hipotezy. Ogólnie rzecz biorąc, statystyka testowa jest wybierana lub definiowana w taki sposób, aby określić ilościowo, w ramach obserwowanych danych, zachowania, które odróżniałyby hipotezę zerową od alternatywnej , gdy taka alternatywa jest zalecana, lub które charakteryzowałyby hipotezę zerową, jeśli istnieje brak wyraźnie sformułowanej alternatywnej hipotezy.

Ważną właściwością statystyki testowej jest to, że jej rozkład próbkowania przy hipotezie zerowej musi być obliczalny, dokładnie lub w przybliżeniu, co pozwala na obliczenie wartości p . A statystyka testowa akcji niektóre z tych samych cech w statystyka opisowa i wiele statystyk może być używany zarówno jako statystyk testowych i statystyki opisowej. Statystyka testowa jest jednak specjalnie przeznaczona do stosowania w testach statystycznych, podczas gdy główną cechą statystyki opisowej jest łatwość jej interpretacji. Niektóre informacyjne statystyki opisowe, takie jak zakres próbki , nie dają dobrych statystyk testowych, ponieważ trudno jest określić ich rozkład próbkowania.

Dwie powszechnie używane statystyki testowe to statystyka t i F-test .

Przykład

Załóżmy, że zadaniem jest sprawdzenie, czy moneta jest uczciwa (tzn. ma równe prawdopodobieństwo wybicia orła lub reszki). Jeśli moneta zostanie obrócona 100 razy, a wyniki zostaną zapisane, surowe dane mogą być reprezentowane jako sekwencja 100 orłów i reszek. Jeśli istnieje zainteresowanie marginalnym prawdopodobieństwem uzyskania ogona, należy zarejestrować tylko liczbę T ze 100 przewrotów, które dały ogon. Ale T można również wykorzystać jako statystykę testową na jeden z dwóch sposobów:

  • Dokładne rozmieszczenie próbek z T na podstawie hipotezy zerowej jest rozkładu dwumianowego o parametrach 0,5 i 100.
  • wartość T można porównać z jej wartością oczekiwaną przy hipotezie zerowej wynoszącej 50, a ponieważ wielkość próby jest duża, rozkład normalny może być użyty jako przybliżenie rozkładu próbkowania albo dla T, albo dla zrewidowanej statystyki testowej T − 50.

Korzystając z jednego z tych rozkładów próbkowania, możliwe jest obliczenie jednostronnej lub dwustronnej wartości p dla hipotezy zerowej, że moneta jest uczciwa. Należy zauważyć, że statystyka testu w tym przypadku redukuje zestaw 100 liczb do pojedynczego podsumowania liczbowego, które można wykorzystać do testowania.

Wspólne statystyki testowe

Testy na jednej próbie są odpowiednie, gdy próbka jest porównywana z populacją z hipotezy. Charakterystyki populacji są znane z teorii lub obliczane na podstawie populacji.

Testy dwupróbkowe są odpowiednie do porównywania dwóch próbek, zwykle próbek doświadczalnych i kontrolnych z eksperymentu kontrolowanego naukowo.

Testy sparowane są odpowiednie do porównywania dwóch próbek, w których nie można kontrolować ważnych zmiennych. Zamiast porównywać dwa zestawy, elementy są parowane między próbkami, więc różnica między elementami staje się próbką. Zazwyczaj średnia z różnic jest następnie porównywana do zera. Typowym przykładowym scenariuszem, w którym odpowiedni jest test sparowanych różnic, to sytuacja, w której do pojedynczego zestawu obiektów testowych zastosowano coś, a test ma na celu sprawdzenie efektu.

Testy Z są odpowiednie do porównywania średnich w surowych warunkach dotyczących normalności i znanego odchylenia standardowego.

T -test właściwe środki do porównywania mocy swobodnej warunkach (zakłada się mniej).

Testy proporcji są analogiczne do testów średnich (proporcja 50%).

Testy chi-kwadrat wykorzystują te same obliczenia i ten sam rozkład prawdopodobieństwa dla różnych zastosowań:

  • Testy chi-kwadrat dla wariancji służą do określenia, czy normalna populacja ma określoną wariancję. Hipoteza zerowa jest taka, że ​​tak.
  • Testy niezależności chi-kwadrat służą do decydowania, czy dwie zmienne są powiązane, czy też są niezależne. Zmienne są kategoryczne, a nie liczbowe. Może być używany do określenia, czy leworęczność jest skorelowana z wzrostem (czy nie). Hipoteza zerowa mówi, że zmienne są niezależne. Liczby użyte w obliczeniach to obserwowane i oczekiwane częstości występowania (z tabel kontyngencji ).
  • Testy zgodności chi-kwadrat służą do określenia adekwatności dopasowania krzywych do danych. Hipoteza zerowa jest taka, że ​​dopasowanie krzywej jest odpowiednie. Powszechne jest określanie kształtów krzywych w celu zminimalizowania błędu średniokwadratowego, dlatego właściwe jest, aby obliczenie dobroci dopasowania sumowało błędy kwadratowe.

Testy F (analiza wariancji, ANOVA) są powszechnie stosowane przy podejmowaniu decyzji, czy grupowanie danych według kategorii ma sens. Jeśli wariancja wyników testu osób leworęcznych w klasie jest znacznie mniejsza niż wariancja całej klasy, przydatne może być badanie leworęcznych jako grupy. Hipoteza zerowa mówi, że dwie wariancje są takie same – więc proponowane grupowanie nie ma sensu.

W poniższej tabeli używane symbole są zdefiniowane na dole tabeli. Wiele innych testów można znaleźć w innych artykułach . Istnieją dowody na to, że statystyki testowe są odpowiednie.

Nazwa Formuła Założenia lub uwagi
Jednopróbkowy test Z (Normalna populacja lub n duża) i σ znane.

( z to odległość od średniej w stosunku do odchylenia standardowego średniej ). Dla rozkładów nienormalnych możliwe jest obliczenie minimalnej części populacji, która mieści się w k odchyleń standardowych dla dowolnego k (patrz: Nierówność Czebyszewa ).

Dwupróbkowy test Z Populacja normalna i niezależne obserwacje oraz σ 1 i σ 2 są znane
Jedną próbkę t -test

(Normalna populacja lub n duża) i nieznana
Sparowany test t

(Normalna populacja różnic lub n duża) i nieznana
Dwie próbki połączono t -Test , równe wariancje


(Normalne populacje lub n 1  +  n 2  > 40) i niezależne obserwacje i σ 1 = σ 2 nieznane
Dwie próbki unpooled t -Test, nierównych wariancji ( Welcha t -test )

(Normalne populacje lub n 1  +  n 2  > 40) i niezależne obserwacje oraz σ 1 ≠ σ 2 oba nieznane
Jednoproporcjonalny test z n . p 0 > 10 i n (1 −  p 0 ) > 10 i jest to SRS (Simple Random Sample), patrz uwagi .
Dwuproporcjonalny test Z, połączony dla

n 1 p 1 > 5 i n 1 (1 −  p 1 ) > 5 i n 2 p 2  > 5 and n 2 (1 −  p 2 ) > 5 oraz niezależne obserwacje, patrz uwagi .
Dwuproporcjonalny test Z, bez puli dla n 1 p 1 > 5 i n 1 (1 −  p 1 ) > 5 i n 2 p 2  > 5 and n 2 (1 −  p 2 ) > 5 oraz niezależne obserwacje, patrz uwagi .
Test chi-kwadrat dla wariancji df = n-1

• Normalna populacja

Test chi-kwadrat na dobroć dopasowania df = k  − 1 −  # parametry oszacowane , a jeden z nich musi zostać zachowany.

• Wszystkie oczekiwane liczby to co najmniej 5.

• Wszystkie oczekiwane zliczenia są > 1 i nie więcej niż 20% oczekiwanych zliczeń jest mniejsze niż 5

Test F dla dwóch prób dla równości wariancji Populacje normalne
Ułóż tak i odrzuć H 0 dla
Regresja t -test Odrzuć H 0 dla * Odejmij 1 dla przecięcia; k terminów zawiera zmienne niezależne.
Ogólnie rzecz biorąc, indeks dolny 0 wskazuje wartość zaczerpniętą z hipotezy zerowej , H 0 , którą należy w jak największym stopniu wykorzystywać przy konstruowaniu jej statystyki testowej. ... Definicje innych symboli:
  • = wariancja próbki
  • = próbka 1 odchylenie standardowe
  • = próbka 2 odchylenie standardowe
  • = statystyka t
  • = stopnie swobody
  • = średnia próbna różnic
  • = hipotetyczna średnia różnica populacji
  • = odchylenie standardowe różnic
  • = Statystyka chi-kwadrat
  • = x/n = proporcja próbki , o ile nie określono inaczej
  • = hipotetyczny odsetek populacji
  • = proporcja 1
  • = proporcja 2
  • = hipotetyczna różnica w proporcjach
  • = minimum n 1 i n 2
  • = statystyka F

Zobacz też

Bibliografia