ANOVA na rangach - ANOVA on ranks

W statystyce jednym z celów analizy wariancji (ANOVA) jest analiza różnic średnich między grupami. Statystyka testowa F zakłada niezależność obserwacji, jednorodne wariancje i normalność populacji . ANOVA dla rang to statystyka zaprojektowana dla sytuacji, w których założenie normalności zostało naruszone.

Logika testu F na średnich

F parametrem jest stosunek liczniku do mianownika. Rozważmy losowo wybrane osoby, które są następnie losowo przypisywane do grup A, B i C. Zgodnie z prawdziwością hipotezy zerowej , zmienność (lub suma kwadratów) wyników dla pewnej zmiennej zależnej będzie taka sama w każdej grupie. Po podzieleniu przez stopnie swobody (tj. Na podstawie liczby badanych w grupie) uzyskuje się mianownik współczynnika F.

Traktuj średnią dla każdej grupy jako wynik i oblicz zmienność (ponownie sumę kwadratów) tych trzech wyników. Po podzieleniu przez stopnie swobody (tj. Na podstawie liczby grup) otrzymujemy licznik współczynnika F.

Zgodnie z prawdziwością hipotezy zerowej, rozkład próbkowania współczynnika F zależy od stopni swobody licznika i mianownika.

Modeluj sposób traktowania grupy A, zwiększając każdy wynik o X. (Model ten utrzymuje podstawowe założenie o jednorodnych wariancjach. W praktyce rzadko - jeśli nie niemożliwe - aby wzrost X w grupie nastąpił poprzez wzrost ocena każdego członka o X). Spowoduje to przesunięcie dystrybucji jednostek X w kierunku dodatnim, ale nie będzie miało żadnego wpływu na zmienność w grupie. Jednak zmienność między średnimi wynikami trzech grup będzie teraz wzrastać. Jeśli wynikowy współczynnik F podnosi wartość do takiego stopnia, że ​​przekracza próg tego, co stanowi rzadkie zdarzenie (zwane poziomem Alfa), mówi się, że test Anova F odrzuca hipotezę zerową równych średnich między trzema grupami, w na korzyść alternatywnej hipotezy, że co najmniej jedna z grup ma większą średnią (w tym przykładzie jest to grupa A).

Postępowanie w przypadku naruszenia normalności populacji

Ranking to jedna z wielu procedur służących do przekształcania danych, które nie spełniają założeń normalności . Conover i Iman dokonali przeglądu czterech głównych typów transformacji rang (RT). Jedna metoda zastępuje każdą oryginalną wartość danych jej rangą (od 1 dla najmniejszej do N dla największej). Ta procedura oparta na rangach została zalecona jako odporna na niestandardowe błędy, odporna na wartości odstające i wysoce wydajna dla wielu dystrybucji. Może to skutkować znaną statystyką (np. W dwóch niezależnych układach próbek rankingu wyników w teście sumy rang Wilcoxona / U Manna – Whitneya ) i zapewnia pożądaną odporność i zwiększoną moc statystyczną, która jest poszukiwana. Na przykład badania Monte Carlo wykazały, że transformację rang w układzie testu t-t dwóch niezależnych próbek można z powodzeniem rozszerzyć na jednokierunkowe niezależne próbki ANOVA, a także na dwie niezależne próbki wielowymiarowe układy T 2 firmy Hotelling Pakiety oprogramowania statystycznego (np. SAS) zastosował się do zaleceń dla analityków danych, aby przeprowadzili swoje zbiory danych za pomocą procedury rankingowej (np. PROC RANK) przed przeprowadzeniem standardowych analiz przy użyciu procedur parametrycznych.

Niepowodzenie rankingu w silniowej ANOVA i innych złożonych układach

ANOVA na rangach oznacza, że ​​standardowa analiza wariancji jest obliczana na danych po przekształceniu rang. Zaproponowano również przeprowadzenie silniowej ANOVA na rangach oryginalnych wyników. Jednak badania Monte Carlo i późniejsze badania asymptotyczne wykazały, że transformacja rang jest nieodpowiednia do testowania efektów interakcji w układzie czynnikowym 4x3 i 2x2x2. W miarę jak liczba efektów (tj. Oddziaływanie główne) staje się różna od zerowej, a wielkość efektów innych niż zerowe rośnie, następuje wzrost błędu typu I , co skutkuje całkowitym błędem statystyki tak wysokim, jak 100% prawdopodobieństwo podjęcia fałszywie pozytywnej decyzji. Podobnie stwierdzono, że transformacja rang coraz bardziej zawodzi w układzie dwóch zależnych próbek, ponieważ korelacja między wynikami przed i po teście wzrasta. Stwierdzono również, że problem stopy błędów typu I został zaostrzony w kontekście analizy kowariancji, zwłaszcza gdy korelacja między zmienną towarzyszącą a zmienną zależną wzrosła.

Transformacja szeregów

Wariantem transformacji rang jest „normalizacja kwantylowa”, w której do rang stosuje się dalsze przekształcenie, tak że otrzymane wartości mają pewien określony rozkład (często rozkład normalny z określoną średnią i wariancją). Dalsze analizy danych znormalizowanych kwantylowo mogą następnie zakładać ten rozkład w celu obliczenia wartości istotności. Jednak wykazano, że dwa określone typy wtórnych transformacji, losowe wyniki normalne i oczekiwana transformacja wyników normalnych, znacznie zawyżają błędy typu I i znacznie zmniejszają moc statystyczną.

Naruszenie homoskedastyczności

ANOVA dla rang nigdy nie była zalecana, gdy podstawowe założenie jednorodnych wariancji zostało naruszone, samodzielnie lub w połączeniu z naruszeniem założenia o normalności populacji. Ogólnie rzecz biorąc, statystyki oparte na rangach stają się mniej wiarygodne w odniesieniu do błędów typu I dla odstępstw od homoskedastyczności nawet szybciej niż ich odpowiedniki parametryczne, które podzielają to samo założenie.

Dalsza informacja

Kepner i Wackerly podsumowali literaturę, zauważając, że „pod koniec lat 80. XX wieku ilość literatury na temat metod RT szybko się rozrastała, ponieważ uzyskano nowe spostrzeżenia, zarówno pozytywne, jak i negatywne, dotyczące użyteczności tej metody. Sawilowsky i wsp. (1989, str. 255) ostrzegli praktyków, aby unikali stosowania tych testów „z wyjątkiem tych specyficznych sytuacji, w których charakterystyka testów jest dobrze zrozumiana”. Według Hettmanspergera i McKeana „Sawilowsky (1990) przedstawia doskonały przegląd nieparametrycznych podejść do testowania interakcji” w ANOVA.

Uwagi