Analiza kowariancji - Analysis of covariance

Analiza kowariancji ( ANCOVA ) jest ogólnym modelem liniowym łączącym ANOVA i regresję . ANCOVA ocenia, czy średnie zmiennej zależnej (DV) są równe na wszystkich poziomach jakościowej zmiennej niezależnej (IV), często nazywanej leczeniem, jednocześnie kontrolując statystycznie wpływ innych zmiennych ciągłych, które nie są głównym przedmiotem zainteresowania, znanych jako współzmienne ( CV) lub uciążliwe zmienne. Matematycznie ANCOVA rozkłada wariancję w DV na wariancję wyjaśnioną przez CV, wariancję wyjaśnioną przez kategorię IV i wariancję resztową. Intuicyjnie, ANCOVA może być postrzegana jako „dostosowanie” DV za pomocą grupowych środków CV(-ów).

Model ANCOVA zakłada liniową zależność między odpowiedzią (DV) a współzmienną (CV):

${\ Displaystyle y_ {ij} = \ mu + \ tau _ {i} + \ operatorname {B} (x_ {ij} - {\ overline {x}}) + \ epsilon _ {ij}.}$

W tym równaniu DV jest j-tą obserwacją w i-tej grupie kategorycznej; CV jest j- tą obserwacją współzmiennej w i- tej grupie. Zmienne w modelu, które pochodzą z obserwowanych danych to (średnia ogólna ) i (średnia globalna dla zmiennej towarzyszącej ). Dopasowane zmienne to (wpływ i- tego poziomu IV), (nachylenie linii) i (powiązany nieobserwowany składnik błędu dla j- tej obserwacji w i- tej grupie). $y_{ij}$ $x_{ij}$ ${\ Displaystyle \ mu}$ ${\overline {x}}$ $x$ ${\ Displaystyle \ tau _ {i}}$ ${\ Displaystyle B}$ $\epsilon_{ij}$

Zgodnie z tą specyfikacją, kategoryczne efekty leczenia sumują się do zera . Zakłada się również, że standardowe założenia modelu regresji liniowej są aktualne, jak omówiono poniżej. ${\ Displaystyle \ lewo (\ suma _ {i} ^ {a} \ tau _ {i} = 0 \ po prawej).}$

Zastosowania

Zwiększ moc

ANCOVA może być wykorzystana do zwiększenia mocy statystycznej (prawdopodobieństwo znalezienia znaczącej różnicy między grupami, jeśli taka istnieje) poprzez zmniejszenie wariancji błędu wewnątrzgrupowego . Aby to zrozumieć, konieczne jest zrozumienie testu używanego do oceny różnic między grupami, testu F . Test F jest obliczany przez podzielenie wyjaśnionej wariancji między grupami (np. różnice w wyzdrowieniu) przez niewyjaśnioną wariancję w obrębie grup. A zatem,

{\ Displaystyle F = {\ Frac {MS_ {między}} {MS_ {w ciągu}}}}

Jeśli ta wartość jest większa niż wartość krytyczna, dochodzimy do wniosku, że istnieje znacząca różnica między grupami. Wariancja niewyjaśniona obejmuje wariancję błędu (np. różnice indywidualne), a także wpływ innych czynników. Dlatego wpływ CV jest pogrupowany w mianowniku. Kiedy kontrolujemy wpływ CV na DV, usuwamy go z mianownika, zwiększając F , zwiększając w ten sposób twoją moc do znalezienia znaczącego efektu, jeśli w ogóle istnieje.

Dostosowywanie istniejących różnic

Innym zastosowaniem ANCOVA jest dostosowanie do istniejących wcześniej różnic w nierównoważnych (nienaruszonych) grupach. Ta kontrowersyjna aplikacja ma na celu skorygowanie początkowych różnic grupowych (przed przypisaniem do grupy), które istnieją w DV między kilkoma nienaruszonymi grupami. W takiej sytuacji uczestnicy nie mogą zostać wyrównani poprzez losowe przydziały, więc CV są używane do dostosowania wyników i upodobnienia uczestników niż bez CV. Jednak nawet przy użyciu współzmiennych nie ma technik statystycznych, które mogłyby zrównać nierówne grupy. Co więcej, CV może być tak blisko związane z IV, że usunięcie wariancji DV związanej z CV usunęłoby znaczną wariancję DV, czyniąc wyniki bez znaczenia.

Założenia

Istnieje kilka kluczowych założeń, które leżą u podstaw stosowania ANCOVA i wpływają na interpretację wyników. Standardowe założenia regresji liniowej są aktualne ; ponadto zakładamy, że nachylenie współzmiennej jest równe we wszystkich grupach leczenia (jednorodność nachyleń regresji).

Założenie 1: liniowość regresji

Relacja regresji między zmienną zależną a zmiennymi towarzyszącymi musi być liniowa.

Założenie 2: jednorodność wariancji błędu

Błąd jest zmienną losową z warunkową zerową średnią i równymi wariancjami dla różnych klas leczenia i obserwacji.

Założenie 3: niezależność terminów błędów

Błędy nie są skorelowane. Oznacza to, że macierz kowariancji błędu jest diagonalna.

Założenie 4: normalność terminów błędów

Do pozostałości (pojęcia błędu) normalnie powinny być rozpowszechniane ~ . $\epsilon_{ij}$ ${\ Displaystyle N (0, \ sigma ^ {2})}$

Założenie 5: jednorodność zboczy regresji

Nachylenia różnych linii regresji powinny być równoważne, tj. linie regresji powinny być równoległe między grupami.

Piąta kwestia, dotycząca jednorodności różnych nachyleń regresji leczenia, jest szczególnie ważna w ocenie adekwatności modelu ANCOVA. Zauważ również, że potrzebujemy tylko terminów błędów, które mają być normalnie dystrybuowane. W rzeczywistości zarówno zmienna niezależna, jak i zmienne towarzyszące w większości przypadków nie będą miały rozkładu normalnego.

Przeprowadzanie ANCOVA

Testuj współliniowość

Jeśli CV jest silnie powiązane z innym CV (przy korelacji 0,5 lub więcej), nie spowoduje to korekty DV ponad inne CV. Jeden lub drugi należy usunąć, ponieważ są one statystycznie zbędne.

Przetestuj założenie jednorodności wariancji

Przetestowane testem Levene'a równości wariancji błędów. Jest to najważniejsze po dokonaniu korekt, ale jeśli masz je przed korektą, prawdopodobnie otrzymasz je później.

Przetestuj założenie jednorodności nachyleń regresji

Aby sprawdzić, czy CV znacząco oddziałuje z IV, uruchom model ANCOVA obejmujący zarówno interakcję IV, jak i CVxIV. Jeśli interakcja CVxIV jest istotna, nie należy wykonywać ANCOVA. Zamiast tego Green i Salkind sugerują ocenę różnic grupowych w DV na poszczególnych poziomach CV. Rozważ również zastosowanie moderowanej analizy regresji , traktując CV i jego interakcję jako kolejną IV. Alternatywnie można wykorzystać analizy mediacyjne w celu ustalenia, czy CV wyjaśnia wpływ IV na DV.

Uruchom analizę ANCOVA

Jeśli interakcja CV×IV nie jest istotna, należy ponownie przeprowadzić ANCOVA bez terminu interakcji CV×IV. W tej analizie musisz użyć skorygowanych średnich i skorygowanego błędu MS. Skorygowane średnie (określane również jako średnie najmniejszych kwadratów, średnie LS, szacowane średnie krańcowe lub EMM) odnoszą się do średnich grupowych po uwzględnieniu wpływu CV na DV.

Prosty wykres efektów głównych pokazujący niewielką interakcję między dwoma poziomami zmiennej niezależnej.

Analizy uzupełniające

Jeśli wystąpił znaczący efekt główny , oznacza to, że istnieje znacząca różnica między poziomami jednej kroplówki, ignorując wszystkie inne czynniki. Aby dokładnie określić, które poziomy znacznie różnią się od siebie, można zastosować te same testy uzupełniające, co w przypadku ANOVA. Jeśli są dwie lub więcej kroplówek, może wystąpić istotna interakcja , co oznacza, że wpływ jednej kroplówki na DV zmienia się w zależności od poziomu innego czynnika. Proste efekty główne można badać tymi samymi metodami, co w czynnikowej ANOVA .

Rozważania dotyczące zasilania

Podczas gdy włączenie zmiennej towarzyszącej do ANOVA ogólnie zwiększa moc statystyczną poprzez uwzględnienie części wariancji zmiennej zależnej, a tym samym zwiększenie stosunku wariancji wyjaśnionej przez zmienne niezależne, dodanie zmiennej towarzyszącej do ANOVA również zmniejsza stopnie swobody . W związku z tym dodanie zmiennej towarzyszącej, która odpowiada za bardzo małą wariancję zmiennej zależnej, może w rzeczywistości zmniejszyć moc.

Zobacz też

MANCOVA ( wieloczynnikowa analiza kowariancji)

Languages

In other projects