F - test - F-test

F -test jest każdy test statystyczny , w którym statystyka testowa ma F -Dystrybucja pod hipotezy zerowej . Jest najczęściej używany podczas porównywania modeli statystycznych , które zostały dopasowane do zbioru danych , w celu zidentyfikowania modelu najlepiej pasującego do populacji, z której pobrano dane. Dokładne „ testy F ” pojawiają się głównie wtedy, gdy modele zostały dopasowane do danych przy użyciu metody najmniejszych kwadratów . Nazwa została wymyślona przez George'a W. Snedecora na cześć Sir Ronalda A. Fishera . Fisher początkowo opracował statystykę jako współczynnik wariancji w latach dwudziestych XX wieku.

Typowe przykłady

Typowe przykłady zastosowania testów F obejmują badanie następujących przypadków:

Hipoteza, że średnie z danego zbioru populacji o rozkładzie normalnym , z których wszystkie mają to samo odchylenie standardowe , są równe. Jest to prawdopodobnie najbardziej znany test F i odgrywa ważną rolę w analizie wariancji (ANOVA).
Hipoteza, że proponowany model regresji dobrze pasuje do danych . Zobacz brak dopasowania sumy kwadratów .
Hipoteza, że zestaw danych w analizie regresji jest zgodny z prostszym z dwóch proponowanych modeli liniowych, które są zagnieżdżone w sobie.

Ponadto niektóre procedury statystyczne, takie jak metoda Scheffégo do korygowania porównań wielokrotnych w modelach liniowych, również wykorzystują testy F.

F - test równości dwóch wariancji

Test F jest wrażliwy na nienormalność . W analizie wariancji (ANOVA), a alternatywne testy obejmują testu Levene'a , Test Bartletta , a testu Brown-Forsythe'em . Jednak gdy którykolwiek z tych testów jest przeprowadzany w celu sprawdzenia podstawowego założenia o homoskedastyczności ( tj. Jednorodności wariancji), jako wstępny krok do testowania średnich efektów, następuje wzrost współczynnika błędów typu I w odniesieniu do eksperymentów .

Formuła i obliczenia

Większość testów F powstaje, gdy rozważa się dekompozycję zmienności w zbiorze danych w postaci sum kwadratów . Statystykę testową w F -test jest stosunek dwóch skalowanych sumy kwadratów odzwierciedlające różne źródeł zmienności. Te sumy kwadratów są konstruowane w taki sposób, że statystyka jest zwykle większa, gdy hipoteza zerowa nie jest prawdziwa. Aby statystyka podążała za rozkładem F w ramach hipotezy zerowej, sumy kwadratów powinny być statystycznie niezależne , a każdy z nich powinien mieć skalowany rozkład χ² . Ten ostatni warunek jest gwarantowany, jeśli wartości danych są niezależne i mają rozkład normalny ze wspólną wariancją .

Problemy ANOVA z wieloma porównaniami

Test F w jednokierunkowej analizie wariancji służy do oceny, czy oczekiwane wartości zmiennej ilościowej w ramach kilku predefiniowanych grup różnią się od siebie. Załóżmy na przykład, że badanie medyczne porównuje cztery metody leczenia. Test F- ANOVA można zastosować do oceny, czy którekolwiek z terapii jest średnio lepsze lub gorsze od innych w porównaniu z hipotezą zerową, że wszystkie cztery terapie dają taką samą średnią odpowiedź. To jest przykład testu „omnibus”, co oznacza, że pojedynczy test jest wykonywany w celu wykrycia kilku możliwych różnic. Alternatywnie, moglibyśmy przeprowadzić testy parami między terapiami (na przykład w badaniu medycznym z czterema zabiegami moglibyśmy przeprowadzić sześć testów w parach zabiegów). Zaletą testu F ANOVA jest to, że nie musimy z góry określać, które zabiegi mają być porównywane, i nie musimy dostosowywać się do dokonywania wielokrotnych porównań . Wadą testu ANOVA F jest to, że jeśli odrzucimy hipotezę zerową , nie wiemy, które zabiegi różnią się znacznie od innych, ani też, jeśli test F jest wykonywany na poziomie α, nie możemy stwierdzić że para badanych z największą średnią różnicą jest znacząco różna na poziomie α.

Wzór na jednokierunkową statystykę F- testu ANOVA to

{\ Displaystyle F = {\ Frac {\ tekst {wyjaśniona wariancja}} {\ tekst {niewyjaśniona wariancja}}},}

lub

{\ Displaystyle F = {\ Frac {\ tekst {zmienność między grupami}} {\ tekst {zmienność wewnątrz grupy}}}.}

Jest to „wyjaśniona wariancja” lub „zmienność międzygrupowa”

{\ Displaystyle \ sum _ {i = 1} ^ {K} n_ {i} ({\ bar {Y}} _ {i \ cdot} - {\ bar {Y}}) ^ {2} / (K- 1)}

gdzie oznacza średnią z próby w i- tej grupie, jest liczbą obserwacji w i- tej grupie, oznacza ogólną średnią danych i oznacza liczbę grup. ${\ displaystyle {\ bar {Y}} _ {i \ cdot}}$ ${\ displaystyle n_ {i}}$ ${\ displaystyle {\ bar {Y}}}$ ${\ displaystyle K}$

„Niewyjaśniona wariancja” lub „zmienność wewnątrzgrupowa” to

{\ Displaystyle \ sum _ {i = 1} ^ {K} \ sum _ {j = 1} ^ {n_ {i}} \ lewo (Y_ {ij} - {\ bar {Y}} _ {i \ cdot } \ right) ^ {2} / (NK),}

gdzie jest j ^th obserwacji w i ^-tej z grup i jest ogólna wielkość próbki. Ta statystyka F podąża za rozkładem F ze stopniami swobody i przy hipotezie zerowej. Statystyka będzie duża, jeśli zmienność międzygrupowa jest duża w stosunku do zmienności wewnątrzgrupowej, co jest mało prawdopodobne, jeśli średnie populacji wszystkich grup mają tę samą wartość. ${\ displaystyle Y_ {ij}}$ ${\ displaystyle K}$ ${\ displaystyle N}$ ${\ displaystyle d_ {1} = K-1}$ ${\ displaystyle d_ {2} = NK}$

Zauważ, że gdy istnieją tylko dwie grupy dla jednokierunkowego testu F -ANOVA , gdzie t jest statystyką Studenta . ${\ displaystyle F = t ^ {2}}$ ${\ displaystyle t}$

Problemy regresji

Rozważ dwa modele, 1 i 2, gdzie model 1 jest „zagnieżdżony” w modelu 2. Model 1 to model ograniczony, a model 2 to model nieograniczony. Oznacza to, że model 1 ma parametry p ₁ , a model 2 ma parametry p ₂ , gdzie p ₁ < p ₂ , a dla dowolnego wyboru parametrów w modelu 1 tę samą krzywą regresji można uzyskać przez wybór parametrów modelu 2.

Jednym z powszechnych kontekstów w tym względzie jest decydowanie, czy model pasuje do danych znacznie lepiej niż model naiwny, w którym jedynym terminem objaśniającym jest wyraz przecięcia, tak że wszystkie przewidywane wartości dla zmiennej zależnej są równe wartości tej zmiennej. próbka średnia. Model naiwny jest modelem ograniczonym, ponieważ współczynniki wszystkich potencjalnych zmiennych objaśniających są ograniczone do zera.

Innym powszechnym kontekstem jest decyzja, czy istnieje strukturalna przerwa w danych: tutaj model ograniczony wykorzystuje wszystkie dane w jednej regresji, podczas gdy model nieograniczony wykorzystuje oddzielne regresje dla dwóch różnych podzbiorów danych. To zastosowanie testu F jest znane jako test Chow .

Model z większą liczbą parametrów zawsze będzie w stanie dopasować dane co najmniej tak dobrze, jak model z mniejszą liczbą parametrów. Zatem zazwyczaj model 2 daje lepsze (tj. Mniejszy błąd) dopasowanie do danych niż model 1. Jednak często chce się ustalić, czy model 2 zapewnia znacznie lepsze dopasowanie do danych. Jednym ze sposobów rozwiązania tego problemu jest użycie testu F.

Jeśli istnieje n punktów danych, na podstawie których można oszacować parametry obu modeli, można obliczyć statystykę F podaną przez

{\ displaystyle F = {\ Frac {\ left ({\ Frac {{\ text {RSS}} _ {1} - {\ text {RSS}} _ {2}} {p_ {2} -p_ {1}) }} \ right)} {\ left ({\ frac {{\ text {RSS}} _ {2}} {n-p_ {2}}} \ right)}},}

gdzie RSS _i jest resztkową sumą kwadratów modelu i . Jeśli model regresji został obliczony za pomocą wag, zamień RSS _{i na} χ ² , ważoną sumę kwadratów reszt. Zgodnie z hipotezą zerową, że model 2 nie zapewnia znacznie lepszego dopasowania niż model 1, F będzie miał rozkład F z ( p ₂ - p ₁ , n - p ₂ ) stopniami swobody . Hipoteza zerowa jest odrzucana, jeśli F obliczone na podstawie danych jest większe niż krytyczna wartość rozkładu F dla pewnego pożądanego prawdopodobieństwa fałszywego odrzucenia (np. 0,05). Test F to test Walda .

Zobacz też

Dobroć dopasowania

Bibliografia

Dalsza lektura

Fox, Karl A. (1980). Średnie statystyki gospodarcze (drugie wydanie). Nowy Jork: John Wiley & Sons. pp. 290–310. ISBN 0-88275-521-8 .
Johnston, John (1972). Metody ekonometryczne (wyd. Drugie). Nowy Jork: McGraw-Hill. s. 35–38.
Kmenta, Jan (1986). Elementy ekonometrii (wyd. Drugie). Nowy Jork: Macmillan. s. 147–148. ISBN 0-02-365070-2 .
Maddala, GS ; Lahiri, Kajal (2009). Wprowadzenie do ekonometrii (czwarta red.). Chichester: Wiley. s. 155–160. ISBN 978-0-470-01512-4 .

Languages

In other projects