Test Dunnetta - Dunnett's test

W statystyce , test Dunnetta jest wielokrotnością porównanie procedura opracowana przez Canadian statystyk Karola DUNNETT porównać każdy z szeregu zabiegów z pojedynczą kontrolą. Wielokrotnych porównań do kontroli określane są także porównań jak wiele-do-jednego.

Historia

Test Dunnetta został opracowany w 1955 roku; zaktualizowana tabela z wartościami granicznymi została opublikowana w 1964 roku.

Problem wielokrotnych porównań

Multiple porównania, wielość lub wielokrotne testowanie Problem pojawia się, gdy weźmiemy pod uwagę zestaw wnioskowań statystycznych jednocześnie lub wnioskuje podzbiór parametrów wybranych na podstawie zaobserwowanych wartości. Główną kwestią w dyskusji procedur wielokrotnego porównania jest kwestia prawdopodobieństwa błędów typu I. Większość różnic między alternatywnymi technikami wynikać z różnych podejść do kwestii, jak kontrolować te błędy. Problem jest w części technicznej; ale to jest naprawdę dużo bardziej subiektywna kwestia, jak chcesz, aby określić poziom błędu i jak duży jesteś gotów pozwolić maksymalny możliwy poziom błędu być. Test Dunnetta są dobrze znane i powszechnie stosowane w procedurze wielokrotnego porównania do równoczesnego porównywania przez interwał oszacowaniu lub testowania hipotezy wszystkich aktywnych zabiegów ze sterowaniem przy pobieraniu próbek z rozkładu gdzie założenie normalność jest rozsądna. Test Dunnetta przeznaczony jest do utrzymywania wskaźnika błędu familywise na poziomie lub poniżej podczas wykonywania wielokrotnych porównań z grupy leczonej z kontrolą.

Korzysta z testu Dunnetta

Oryginalna praca na wielu problemu porównania została wykonana przez Tukeya i Scheffego . Ich metoda była ogólnie jeden, w którym uwzględniono wszystkie rodzaje porównań parami. Tukeya i metody Scheffego umożliwiają dowolną liczbę porównań między zestawem przykładowych środków. Z drugiej strony, test Dunnetta porównuje tylko jedną grupę z innymi, zwracając szczególną przypadku wielokrotnych porównań problemu - porównań parami wielu grup terapeutycznych z jednej grupy kontrolnej. W ogólnym przypadku, gdzie porównania każdej pary wykonujemy porównań (gdzie k to liczba grup), ale w porównaniu z leczeniem kontroluje sprawy będziemy tylko zrobić porównań. Jeśli w przypadku leczenia i kontroli grup byliśmy użyć bardziej ogólnych metod Tukeya i Scheffe, mogą powodować niepotrzebnie szerokie przedziały ufności. Test Dunnetta uwzględnia szczególną strukturę porównując leczenie przeciwko kontroli, otrzymując w węższych przedziałów ufności. Jest to bardzo powszechna w użyciu testu Dunnetta w badaniach medycznych, na przykład porównanie pomiarów liczby komórek krwi w trzech grupach zwierząt, z których jedna służyła jako kontrola, podczas gdy inne dwa były traktowane z dwóch różnych leków. Innym powszechnym zastosowaniem tej metody jest między agronomów: agronomów może chcieć zbadać działanie niektórych chemikaliów dodawanych do gleby na plon upraw, dlatego opuści kilka działek nieleczonych (poletka kontrolne) i porównać je do działek gdzie chemikalia zostały dodane do gleby (wykresy leczenia).

Formalny opis testu Dunnetta

Test Dunnetta jest wykonywana przez obliczanie t-Studenta statystyki dla każdego doświadczalnego lub leczenia, gdzie grupy porównuje statystykę grupie leczonej do jednej grupy kontrolnej. Ponieważ każdy ma takie samo porównanie wspólną kontrolę, procedura zawiera zależności między tych porównań. W szczególności t-statystyki są pochodzą z tego samego oszacowania wariancji błędu, który jest uzyskany przez połączenie z sumy kwadratów błędu we wszystkich leczonych (a) grup kontrolnych. Formalne statystyka testowa dla testu Dunnetta jest albo największa pod względem wartości bezwzględnej tych statystyk t (jeśli wymagana jest dwustronny test) lub najbardziej negatywne lub najbardziej pozytywny z T-statystycznych (jeżeli jednostronny test jest wymagany).

W teście Dunnetta możemy wykorzystywać wspólną tabelę wartości krytycznych, ale bardziej elastyczne opcje są obecnie łatwo dostępne w wielu statystyk pakietów, takich jak R . Krytyczne wartości dla danego punktu procentowego zależą od: czy jedno lub- dwustronny test przeprowadzono; liczba grup porównywanych ogólna liczba prób.

założenia

Analiza rozważa przypadek, w którym wyniki eksperymentu numerycznego, a eksperyment przeprowadzono w celu porównania zabiegi p z grupą kontrolną. Wyniki można podsumować jako zbiór obliczonych pomocą zestawów obserwacji , podczas gdy odnosimy się do leczenia i odnosi się do zestawu sterującego obserwacji i jest niezależną oszacowanie wspólnym odchylenie standardowe wszystkich zestawów obserwacji. Wszystko z zestawów obserwacji przyjmuje się niezależnie i rozkład normalny ze wspólnej wariancji i środków . Istnieje również przypuszczenie, że nie jest dostępny szacunek dla .

Obliczenie

Wyliczenie Dunnetta testu jest to procedura, która opiera się na obliczaniu sprawozdania ufności o prawdziwej lub oczekiwanych wartościach różnic , a tym samym różnic między średnimi grup terapeutycznych i średniej grupie kontrolnej za. Procedura ta zapewnia, że prawdopodobieństwo wszystkich sprawozdań , będących jednocześnie poprawne jest równa określonej wartości . Przy obliczaniu jednostronnego górnej (lub dolnej), przedział ufności dla prawdziwej wartości różnicy pomiędzy średnią z leczenia i grupie kontrolnej , oznacza prawdopodobieństwo, że wartość rzeczywista będzie poniżej górnej (lub większa od dolnej) Termin tego przedziału. Przy obliczaniu dwustronny przedział ufności , stanowi prawdopodobieństwo, że prawdziwa wartość będzie pomiędzy górnymi i dolnymi ograniczeniami.

Po pierwsze, będziemy oznaczać dostępne N uwagami gdy a i oszacowania wspólnej wariancji , na przykład: gdy jest średnią z grupy i jest liczbą obserwacji w grupie , a stopnie swobody. Jak wspomniano wcześniej, chcielibyśmy uzyskać oddzielne przedziały ufności dla każdego z różnic takie, że prawdopodobieństwo, że wszystkie przedziały ufności będzie zawierać odpowiedni jest równa .

Weźmiemy pod uwagę ogólną sytuację, w której istnieją grupy terapeutyczne i grupy jedna kontrola. Będziemy pisać:

będziemy też pisać: , który następuje po t-Studenta statystyczny rozkład zn stopniami swobody . Dolne granice ufności ze wspólnym współczynnikiem ufności dla efektów leczenia będzie dane przez:

oraz stałe dobiera się tak, że . Podobnie, górna granica będzie dane przez:

Za ograniczające w obu kierunkach, co następuje przerwa może zostać podjęta:

gdy dobiera się zaspokoić . Rozwiązaniem tych szczególnych wartości dla dwustronnego testu i w jednym teście jednostronnym podano w tabelach. Zaktualizowana tabela z wartościami granicznymi została opublikowana w 1964 roku.

Przykłady

Wytrzymałość na rozerwanie tkaniny

Poniższy przykład został zaadaptowany z określoną przez Villars [6]. Dane przedstawiają pomiary wytrzymałości na rozerwanie materiału poddanego obróbce według trzech różnych procesach chemicznych w porównaniu z typową metodą wytwarzania.

wytrzymałość na rozerwanie (lb).
standard proces 1 Sposób 2 Sposób 3:
55 55 55 50
47 64 49 44
48 64 52 41
Znaczy 50 61 52 45
Zmienność 19 27 9 21

Powyżej p = 3 i n = 3. Średnia wariancji , który jest szacowany wspólnym zmienności z czterech zestawów z (p + 1) (n-1) = 8 stopni swobody. To może być obliczona w następujący sposób:

,

Odchylenie standardowe jest i szacowane odchylenie standardowe różnicy między dwoma środkami jest .

Ilość, która musi być dodana i / lub odejmowane z zaobserwowanych różnic pomiędzy średnimi otrzymując swoje granice ufności została wywołana przez Tukeya Określenie „dodatek” i podaje się , gdzie t jest otrzymywany z tabeli Dunnetta 1, jeśli jeden ograniczenia boczne są pożądane lub z tabeli Dunnetta 2, jeśli granice dwustronne są pożądane. Dla p = 3, a df = 8, t = 2,42 w odniesieniu do jednego ograniczenia boczne i t = 2,88 dla dwustronnego ograniczeń dla p = 95%. Analogiczne wartości T można określić w tabelach, czy wymagane jest P = 99% CI. Limitów jednostronnych, dodatek jest A = (2,42) (3,56) = 9, a eksperymentator można stwierdzić, że:

  • Wytrzymałość na rozerwanie za pomocą procesu 1 przekracza poziom co najmniej
  • Wytrzymałość na rozerwanie za pomocą procesu 2 przekracza poziom co najmniej .
  • Wytrzymałość na rozerwanie za pomocą procesu 3 przekracza poziom co najmniej .

Wspólne oświadczenie składające się z trzech powyższych wniosków ma współczynnik ufności 95%, czyli na dłuższą metę, 95% takich wspólnych oświadczeń będzie faktycznie być poprawne. Granice dla trzech różnice można otrzymać w analogiczny sposób. Limitów dwustronny, dodatek jest A = (2,94) (3,56) = 11 a eksperymentator można stwierdzić, że:

  • Wytrzymałość na rozerwanie za pomocą procesu 1 przekracza poziom w ilości od

i

  • Wytrzymałość na rozerwanie za pomocą procesu 2 przekracza poziom w ilości od

a .

  • Wytrzymałość na rozerwanie za pomocą procesu 3 przewyższa poziom o ilość między

a . Wspólny współczynnik ufności dla tych trzech rachunku jest większa niż 95%. (Ze względu na w przybliżeniu wykonana w informatyce tabelach 2a i 2b, podane w tabeli wartości T są nieco większa niż to jest konieczne, tak, że rzeczywiste wartości p osiągane są nieco większe niż 95 do 99% .no takiego zbliżenia powstał obliczeniowej tabele 1A i 1B) ,

Referencje

  1. ^ Upton G. & Cook I. (2006), A Dictionary of Statistics , 2e, Oxford University Press, Oxford, Wielka Brytania.
  2. ^ Rumsey Deborah (2009-08-19). Statystyka II for Dummies . Źródło 2012-08-22 .
  3. ^ Everett BS & Shrondal A. (2010) The Cambridge słownik Statystyczny , 4e, Cambridge University Press, Cambridge, Wielka Brytania.
  4. ^ "Oprogramowanie statystyczne | University of Kentucky Information Technology" . Uky.edu . Źródło 2012-08-22 .
  5. ^ B c d Dunnetta CW (1955), "tryb porównania wielokrotnego porównywania kilka zabiegów w kontroli", Journal of American Statistical Association , 50 : 1096/21.
  6. ^ B Dunnetta CW (1964) „Nowe stoły do wielokrotnych porównań z kontrolą”, Biometria , 20 : 482-491.
  7. ^ B c David Howell, "C. Metody statystyczne Psychology", 8 wyd.
  8. ^ Test Dunnetta , HyperStat Online: AN Statystyki wstępne Podręcznik i Online Tutorial o pomoc w statystykach Kursów
  9. ^ Mechanika różne testy - Biostatystyki BI 345 , w Saint Anselm College