Projekt pomiarów wielokrotnych - Repeated measures design

Projekt pomiarów powtarzanych to projekt badawczy, który obejmuje wiele pomiarów tej samej zmiennej podjętych na tych samych lub dopasowanych przedmiotach w różnych warunkach lub w dwóch lub więcej okresach czasu. Na przykład, powtarzane pomiary są gromadzone w badaniu podłużnym, w którym ocenia się zmiany w czasie.

Badania crossover

Popularnym powtarzanym pomiarem jest badanie krzyżowe . Badanie krzyżowe to badanie podłużne, w którym pacjenci otrzymują sekwencję różnych terapii (lub ekspozycji). Chociaż badania krzyżowe mogą być badaniami obserwacyjnymi , wiele ważnych badań krzyżowych to eksperymenty kontrolowane . Projekty crossoverów są powszechne w eksperymentach w wielu dyscyplinach naukowych , na przykład w psychologii , edukacji , naukach farmaceutycznych i opiece zdrowotnej , zwłaszcza medycynie.

Randomizowane , kontrolowane eksperymenty krzyżowe są szczególnie ważne w opiece zdrowotnej. W randomizowanym badaniu klinicznym pacjentom przydzielono losowo terapie. Gdy taka próba jest projektem z powtarzanymi pomiarami, osobnicy są losowo przydzielani do sekwencji terapii. Krzyżowe badanie kliniczne to projekt z powtarzanymi pomiarami, w którym każdy pacjent jest losowo przypisywany do sekwencji terapii, w tym co najmniej dwóch terapii (z których jeden może być standardowym leczeniem lub placebo ): w ten sposób każdy pacjent przechodzi z jednego leczenia do innego.

Prawie wszystkie projekty krzyżowe mają „równowagę”, co oznacza, że ​​wszyscy pacjenci powinni otrzymać taką samą liczbę zabiegów i że wszyscy pacjenci uczestniczą w tej samej liczbie okresów. W większości prób krzyżowych każdy pacjent otrzymuje wszystkie terapie.

Jednak wiele schematów z powtórzonymi pomiarami nie jest crossoverami: podłużne badanie sekwencyjnych efektów powtarzanych zabiegów nie musi wykorzystywać żadnego „ crossovera ”, na przykład (Vonesh & Chinchilli; Jones & Kenward).

Używa

  • Ograniczona liczba uczestników - projekt powtarzanych pomiarów zmniejsza wariancję oszacowań efektów leczenia, umożliwiając wnioskowanie statystyczne na mniejszej liczbie badanych.
  • Wydajność - projekty z powtarzanymi pomiarami pozwalają na szybsze wykonanie wielu eksperymentów, ponieważ do ukończenia całego eksperymentu trzeba przeszkolić mniej grup. Na przykład eksperymenty, w których każdy warunek zajmuje tylko kilka minut, podczas gdy szkolenie do wykonania zadań zajmuje tyle samo, jeśli nie więcej czasu.
  • Analiza podłużna - projekty powtarzanych miar pozwalają badaczom monitorować zmiany uczestników w czasie, zarówno w sytuacjach długo-, jak i krótkoterminowych.

Zamów efekty

Efekt kolejności może wystąpić, gdy uczestnik eksperymentu jest w stanie wykonać zadanie, a następnie wykonać je ponownie. Przykłady efektów kolejności obejmują poprawę wydajności lub spadek wydajności, który może być spowodowany efektami uczenia się, nudą lub zmęczeniem. Wpływ efektów kolejności może być mniejszy w długoterminowych badaniach podłużnych lub w wyniku równoważenia przy użyciu projektu krzyżowego .

Równoważenie

W tej technice dwie grupy wykonują te same zadania lub doświadczają tych samych warunków, ale w odwrotnej kolejności. W przypadku dwóch zadań lub warunków tworzone są cztery grupy.

Równoważenie
Zadanie / warunek Zadanie / warunek Uwagi
grupa A
1
2
Grupa A wykonuje najpierw Zadanie / Warunek 1, a następnie Zadanie / Warunek 2
Grupa B.
2
1
Grupa B najpierw wykonuje Zadanie / Warunek 2, a następnie Zadanie / Warunek 1

Równoważenie próbuje uwzględnić dwa ważne źródła systematycznej zmienności w tego typu projektach: praktykę i efekty nudy. Oba mogą w przeciwnym razie prowadzić do różnych wyników uczestników z powodu zaznajomienia się z zabiegami lub zmęczenia nimi.

Ograniczenia

Może nie być możliwe, aby każdy uczestnik był we wszystkich warunkach eksperymentu (tj. Ograniczenia czasowe, miejsce eksperymentu itp.). Osoby z ciężkimi chorobami zwykle wypadają z badań podłużnych, co może wpływać na wyniki. W takich przypadkach preferowane byłyby modele efektów mieszanych, ponieważ mogą one radzić sobie z brakującymi wartościami.

Średnia regresja może wpływać na stany z istotnymi powtórzeniami. Dojrzewanie może wpływać na badania, które trwają w czasie. Wydarzenia poza eksperymentem mogą zmienić reakcję między powtórzeniami.

Powtarzane pomiary ANOVA

Analiza wariancji z powtarzanymi miarami (rANOVA) jest powszechnie stosowanym podejściem statystycznym do projektów z powtarzanymi pomiarami. W takich projektach czynnik powtarzanego pomiaru (jakościowa zmienna niezależna) jest czynnikiem wewnątrzobiektowym, podczas gdy zależna zmienna ilościowa, na której mierzy się każdy uczestnik, jest zmienną zależną.

Partycjonowanie błędu

Jedną z największych zalet rANOVA, podobnie jak w przypadku projektów z powtarzanymi pomiarami w ogóle, jest możliwość wyodrębnienia zmienności wynikającej z indywidualnych różnic. Rozważ ogólną strukturę statystyki F :

F = Leczenie SM / Błąd SM = ( Leczenie SS / Leczenie df ) / ( Błąd SS / Błąd df )

W projekcie międzyprzedmiotowym występuje element wariancji wynikający z indywidualnej różnicy, który jest połączony z traktowaniem i błędami:

SS Razem = SS Leczenie + SS błąd
df Razem = n - 1

W projekcie z powtarzanymi pomiarami możliwe jest oddzielenie zmienności podmiotu od warunków leczenia i błędów. W takim przypadku zmienność można podzielić na zmienność między zabiegami (lub efekty wewnątrzosobnicze, z wyłączeniem różnic indywidualnych) i zmienność wewnątrz zabiegów. Zmienność wewnątrz leczenia można dalej podzielić na zmienność międzyosobniczą (różnice indywidualne) i błąd (z wyłączeniem różnic indywidualnych):

SS Wszystkich = SS leczenia (z wyłączeniem różnic indywidualnych) + SS Przedmioty + SS Error
df Suma = df Leczenie (u pacjentów) + df między pacjentami + błąd df = ( k - 1) + ( n - 1) + (( n - k ) ( n - 1))

W odniesieniu do ogólnej struktury statystyki F, jasne jest, że poprzez wyodrębnienie zmienności między podmiotami, wartość F wzrośnie, ponieważ suma kwadratów składnika błędu będzie mniejsza, co spowoduje mniejszy błąd MSError. Warto zauważyć, że zmienność partycjonowania zmniejsza stopnie swobody z testu F, dlatego zmienność między obiektami musi być wystarczająco duża, aby zrównoważyć utratę stopni swobody. Jeśli zmienność między podmiotami jest niewielka, proces ten może faktycznie zmniejszyć wartość F.

Założenia

Podobnie jak w przypadku wszystkich analiz statystycznych, należy spełnić określone założenia, aby uzasadnić zastosowanie tego testu. Naruszenia mogą mieć umiarkowany lub poważny wpływ na wyniki i często prowadzą do powiększenia błędu typu 1 . W przypadku rANOVA obowiązują standardowe jednoczynnikowe i wielowymiarowe założenia. Założenia jednowymiarowe to:

  • Normalność - dla każdego poziomu czynnika wewnątrzobiektowego zmienna zależna musi mieć rozkład normalny .
  • Sferyczność - wyniki różnic obliczone między dwoma poziomami czynnika wewnątrzobiektu muszą mieć taką samą wariancję dla porównania dowolnych dwóch poziomów. (To założenie ma zastosowanie tylko wtedy, gdy istnieją więcej niż 2 poziomy zmiennej niezależnej).
  • Losowość - przypadki powinny pochodzić z losowej próby, a wyniki uzyskane od różnych uczestników powinny być od siebie niezależne.

RANOVA wymaga również spełnienia pewnych założeń wielowymiarowych, ponieważ test wielowymiarowy przeprowadza się na wynikach różnic. Te założenia obejmują:

  • Normalność wieloczynnikowa - wyniki różnic mają rozkład normalny dla wielu zmiennych w populacji.
  • Losowość - indywidualne przypadki powinny pochodzić z losowej próby, a wyniki różnic dla każdego uczestnika są niezależne od wyników innego uczestnika.

Test F.

Podobnie jak w przypadku innych analiz testów wariancji, rANOVA wykorzystuje statystykę F do określenia istotności. W zależności od liczby czynników wewnątrzprzedmiotowych i naruszeń założeń konieczne jest wybranie najbardziej odpowiedniego z trzech testów:

  • Standardowy test F jednowymiarowej ANOVA - ten test jest powszechnie stosowany przy tylko dwóch poziomach czynnika wewnątrzobiektu (tj. Punkt czasowy 1 i punkt czasowy 2). Ten test nie jest zalecany, biorąc pod uwagę więcej niż 2 poziomy współczynnika wewnątrzobiektu, ponieważ założenie o sferyczności jest w takich przypadkach powszechnie naruszane.
  • Alternatywny test jednowymiarowy - te testy wyjaśniają naruszenia założenia sferyczności i mogą być stosowane, gdy współczynnik wewnątrzobiektu przekracza 2 poziomy. Statystyka F jest taka sama jak w standardowym teście F z jedną zmienną ANOVA, ale jest związana z dokładniejszą wartością p. Ta korekta jest wykonywana przez zmniejszenie stopni swobody w celu określenia krytycznej wartości F. Powszechnie stosowane są dwie poprawki: poprawka Greenhouse – Geissera i poprawka Huynha – Feldta. Poprawka Greenhouse – Geisser jest bardziej konserwatywna, ale rozwiązuje powszechny problem rosnącej zmienności w czasie w projekcie z powtarzanymi pomiarami. Poprawka Huynha – Feldta jest mniej konserwatywna, ale nie rozwiązuje kwestii rosnącej zmienności. Sugerowano, że niższe Huynh – Feldt być używane przy mniejszych odstępach od kulistości, podczas gdy Greenhouse – Geisser być używane, gdy odejścia są duże.
  • Test na wielu odmianach - ten test nie zakłada sferyczności, ale jest również wysoce konserwatywny.

Rozmiar efektu

Jedną z najczęściej zgłaszanych statystyk wielkości efektu dla rANOVA jest częściowe eta-kwadrat (η p 2 ). Powszechne jest również stosowanie wielowymiarowej η 2, gdy założenie o sferyczności zostało naruszone, a statystyka testu wielowymiarowego jest raportowana. Trzecią raportowaną statystyką wielkości efektu jest uogólniona η 2 , która jest porównywalna z η p 2 w jednostronnie powtarzanych pomiarach ANOVA. Wykazano, że jest to lepsze oszacowanie wielkości efektu w przypadku innych testów wewnątrzosobniczych.

Przestrogi

rANOVA nie zawsze jest najlepszą analizą statystyczną dla projektów z powtarzanymi pomiarami. RANOVA jest podatna na skutki braku wartości, przypisania, nierównomiernych punktów czasowych między badanymi i naruszenia sferyczności. Te problemy mogą skutkować odchyleniem próbkowania i zawyżonymi wskaźnikami błędu typu I. W takich przypadkach może być lepiej rozważyć zastosowanie liniowego modelu mieszanego .

Zobacz też

Uwagi

Bibliografia

Projektowanie i analiza eksperymentów

  • Jones, Byron; Kenward, Michael G. (2003). Projektowanie i analiza prób krzyżowych (wyd. Drugie). Londyn: Chapman and Hall.
  • Vonesh, Edward F. i Chinchilli, Vernon G. (1997). Modele liniowe i nieliniowe do analizy powtarzanych pomiarów . Londyn: Chapman and Hall.

Eksploracja danych podłużnych

  • Davidian, Marie ; David M. Giltinan (1995). Nieliniowe modele dla powtarzanych danych pomiarowych . Chapman & Hall / CRC Monographs on Statistics & Applied Prawdopodobieństwo. ISBN   978-0-412-98341-2 .
  • Fitzmaurice, Garrett; Davidian, Marie; Verbeke, Geert; Molenberghs, Geert, wyd. (2008). Analiza danych podłużnych . Boca Raton, Floryda: Chapman and Hall / CRC. ISBN   978-1-58488-658-7 .
  • Jones, Byron; Kenward, Michael G. (2003). Projektowanie i analiza prób krzyżowych (wyd. Drugie). Londyn: Chapman and Hall.
  • Kim, Kevin i Timm, Neil (2007). " " Restricted MGLM a krzywa wzrostu Model "(rozdział 7)." Ogólne modele liniowe dla jednowymiarowych i wielowymiarowych: teoria i aplikacje z SAS (z 1 CD-ROM dla Windows i UNIX) . Statystyka: podręczniki i monografie (wyd. Drugie). Boca Raton, Floryda: Chapman & Hall / CRC. ISBN   978-1-58488-634-1 .
  • Kollo, Tõnu & von Rosen, Dietrich (2005). „ Wieloczynnikowa modele liniowe „(patrz rozdział 4), w szczególności«Krzywa model wzrostu jak i rozszerzenia»(patrz rozdział 4.1).” Zaawansowane statystyki wielowymiarowe z macierzami . Matematyka i jej zastosowania. 579 . Nowy Jork: Springer. ISBN   978-1-4020-3418-3 .
  • Kshirsagar, Anant M. & Smith, William Boyce (1995). Krzywe wzrostu . Statystyka: podręczniki i monografie. 145 . Nowy Jork: Marcel Dekker, Inc. ISBN   0-8247-9341-2 .
  • Pan, Jian-Xin i Fang, Kai-Tai (2002). Modele krzywych wzrostu i diagnostyka statystyczna . Seria Springer w statystykach. Nowy Jork: Springer-Verlag. ISBN   0-387-95053-2 .
  • Seber, GAF i Wild, CJ (1989). „ Modele wzrostu (rozdział 7) ”. Regresja nieliniowa . Seria Wiley w prawdopodobieństwie i statystykach matematycznych: prawdopodobieństwo i statystyka matematyczna. Nowy Jork: John Wiley & Sons, Inc. str. 325–367. ISBN   0-471-61760-1 .
  • Timm, Neil H. (2002). „ Ogólny model MANOVA (GMANOVA) ”(rozdział 3.6.d)”. Zastosowana analiza wielowymiarowa . Springer Texts in Statistics. Nowy Jork: Springer-Verlag. ISBN   0-387-95347-7 .
  • Vonesh, Edward F. i Chinchilli, Vernon G. (1997). Modele liniowe i nieliniowe do analizy powtarzanych pomiarów . Londyn: Chapman and Hall. (Kompleksowe podejście do teorii i praktyki)
  • Conaway, M. (1999, 11 października). Projektowanie powtarzanych pomiarów. Pobrano 18 lutego 2008 r. Z http://biostat.mc.vanderbilt.edu/twiki/pub/Main/ClinStat/repmeas.PDF
  • Minke, A. (1997, styczeń). Przeprowadzanie analiz z powtarzanymi pomiarami: rozważania dotyczące projektu eksperymentalnego. Pobrano 18 lutego 2008 r. Z Ericae.net: http://ericae.net/ft/tamu/Rm.htm
  • Shaughnessy, JJ (2006). Metody badawcze w psychologii. Nowy Jork: McGraw-Hill.

Linki zewnętrzne