Ograniczona randomizacja - Restricted randomization

W statystykach , ograniczony randomizacji występuje w projektowaniu eksperymentów , w szczególności w kontekście randomizowanych eksperymentów i randomizacją . Ograniczona randomizacja pozwala na uniknięcie intuicyjnie złego przydziału terapii do jednostek eksperymentalnych, przy jednoczesnym zachowaniu teoretycznych korzyści wynikających z randomizacji. Na przykład w badaniu klinicznym nowego proponowanego leczenia otyłości w porównaniu z grupą kontrolną eksperymentator chciałby uniknąć wyników randomizacji, w której nowe leczenie przydzielono tylko najcięższym pacjentom.

Koncepcja została wprowadzona przez Franka Yatesa (1948) i Williama J. Youdena (1972) „jako sposób na uniknięcie złych wzorców przestrzennych zabiegów w projektowanych eksperymentach”.

Przykład danych zagnieżdżonych

Rozważmy proces wsadowy, który wykorzystuje 7 płytek monitora w każdym przebiegu. Plan wymaga ponadto pomiaru zmiennej odpowiedzi na każdej płytce w każdym z 9 miejsc. Organizacja planu pobierania próbek ma strukturę hierarchiczną lub zagnieżdżoną: przebieg partii to najwyższy poziom, drugi poziom to indywidualna płytka, a trzeci poziom to miejsce na płytce.

Całkowita ilość danych wygenerowanych na serię wyniesie 7,9 = 63 obserwacje. Jednym ze sposobów analizy tych danych byłoby obliczenie średniej ze wszystkich tych punktów, jak również ich odchylenia standardowego i wykorzystanie tych wyników jako odpowiedzi dla każdego przebiegu.

Analiza danych, jak zasugerowano powyżej, nie jest całkowicie błędna, ale takie postępowanie powoduje utratę informacji, które można by uzyskać w inny sposób. Na przykład miejsce 1 na płytce 1 jest fizycznie inne niż miejsce 1 na płytce 2 lub na jakimkolwiek innym waflu. To samo dotyczy wszystkich witryn na którymkolwiek z płytek. Podobnie, płytka 1 w przebiegu 1 fizycznie różni się od płytki 1 w przebiegu 2 i tak dalej. Aby opisać tę sytuację, mówi się, że witryny są zagnieżdżone w ramach płytek, podczas gdy płytki są zagnieżdżone w przebiegach.

W wyniku tego zagnieżdżenia istnieją ograniczenia dotyczące randomizacji, które mogą wystąpić w eksperymencie. Ten rodzaj ograniczonej randomizacji zawsze prowadzi do zagnieżdżonych źródeł zmienności. Przykłady zagnieżdżonego zmienności lub ograniczonej randomizacji omówione na tej stronie są split-plot i strip-plot wzory .

Celem eksperymentu z tego typu planem pobierania próbek jest ogólnie zmniejszenie zmienności wynikającej z miejsc umieszczenia płytek i płytek w ramach serii (lub partii) w procesie. Miejsca na waflach i wafle w partii stają się źródłami niepożądanej zmienności, a badacz stara się, aby system był odporny na te źródła - innymi słowy, można traktować płytki i miejsca jako czynniki hałasu w takim eksperymencie.

Ponieważ płytki i miejsca stanowią niepożądane źródła zmienności oraz ponieważ jednym z celów jest zmniejszenie wrażliwości procesu na te źródła zmienności, traktowanie płytek i miejsc jako efektów losowych w analizie danych jest rozsądnym podejściem. Innymi słowy, zagnieżdżona wariacja jest często innym sposobem na określenie zagnieżdżonych efektów losowych lub zagnieżdżonych źródeł szumu. Jeżeli czynniki „opłatki” i „miejsca” są traktowane jako efekty losowe, wówczas możliwe jest oszacowanie komponentu wariancji z powodu każdego źródła zmienności poprzez analizę technik wariancji . Po uzyskaniu szacunków składowych wariancji badacz jest następnie w stanie określić największe źródło zmienności w procesie będącym przedmiotem eksperymentu, a także określić wielkości innych źródeł zmienności w stosunku do największego źródła.

Zagnieżdżone efekty losowe

Jeśli eksperyment lub proces ma zagnieżdżoną odmianę, eksperyment lub proces ma wiele źródeł losowych błędów, które wpływają na jego wynik. Zagnieżdżone efekty losowe w modelu to to samo, co zagnieżdżona zmienność w modelu.

Projekty z dzielonymi działkami

Plany podzielone powstają, gdy podczas eksperymentu wystąpił określony typ ograniczonej randomizacji. Prosty eksperyment czynnikowy może skutkować projektem typu split-plot ze względu na sposób, w jaki eksperyment został faktycznie wykonany.

W wielu eksperymentach przemysłowych często występują trzy sytuacje:

  1. niektóre z interesujących czynników mogą być „trudne do zmiany”, podczas gdy pozostałe są łatwe do zmiany. W rezultacie kolejność, w jakiej są przeprowadzane kombinacje zabiegów w eksperymencie, jest określana przez uporządkowanie tych „trudnych do zmiany” czynników
  2. jednostki doświadczalne są przetwarzane razem jako partia dla jednego lub większej liczby czynników w określonej kombinacji zabiegów
  3. jednostki eksperymentalne są przetwarzane indywidualnie, jedna po drugiej, dla tej samej kombinacji terapii bez resetowania ustawień współczynnika dla tej kombinacji terapii.

Eksperymentalne przykłady podzielonego wykresu

Eksperyment przeprowadzony w jednej z trzech powyższych sytuacji zwykle skutkuje projektem typu split-plot. Rozważ eksperyment polegający na zbadaniu galwanizacji aluminium (niewodnego) na taśmach miedzianych. Trzy interesujące czynniki to: prąd (A); temperatura roztworu (T); i stężenie roztworu środka powlekającego (S). Szybkość powlekania to zmierzona odpowiedź. Do eksperymentu dostępnych jest łącznie 16 miedzianych pasków. Kombinacje zabiegów do przeprowadzenia (skalowane ortogonalnie) są wymienione poniżej w standardowej kolejności (tj. Nie zostały randomizowane):

Kombinacje leczenia skalowane ortogonalnie z 2 3 pełnych silni
obecny Temperatura Stężenie
−1 −1 −1
−1 −1 +1
−1 +1 −1
−1 +1 +1
+1 −1 −1
+1 −1 +1
+1 +1 −1
+1 +1 +1

Przykład: niektóre czynniki są trudne do zmiany

Rozważ przeprowadzenie eksperymentu w pierwszym z warunków wymienionych powyżej, ponieważ stężenie roztworu czynnika do powlekania (S) jest trudne do zmiany. Ponieważ ten czynnik jest trudny do zmiany, eksperymentator chciałby randomizować kombinacje zabiegów, tak aby współczynnik stężenia roztworu miał minimalną liczbę zmian. Innymi słowy, randomizacja przebiegów obróbki jest nieco ograniczona poziomem współczynnika stężenia roztworu.

W rezultacie kombinacje traktowań mogą być randomizowane w taki sposób, że te serie leczenia odpowiadające jednemu poziomowi stężenia (-1) są przeprowadzane jako pierwsze. Każda taśma miedziana jest indywidualnie powlekana, co oznacza, że ​​w roztworze dla danej kombinacji zabiegów umieszczany jest tylko jeden pasek na raz. Po zakończeniu czterech serii przy niskim poziomie stężenia roztworu, roztwór zmienia się na wysoki poziom stężenia (1) i przeprowadza się pozostałe cztery serie eksperymentu (gdzie ponownie każdy pasek jest indywidualnie wysiewany).

Po zakończeniu jednego pełnego powtórzenia doświadczenia wykonuje się drugie powtórzenie z zestawem czterech pasków miedzianych przetworzonych dla danego poziomu stężenia roztworu, przed zmianą stężenia i obróbką pozostałych czterech pasków. Zwróć uwagę, że poziomy pozostałych dwóch czynników mogą być nadal wybierane losowo. Ponadto poziom stężenia, który jest uruchamiany jako pierwszy w cyklach replikacji, może być również randomizowany.

Przeprowadzenie eksperymentu w ten sposób skutkuje projektem podzielonego wykresu . Stężenie roztworu jest znane jako współczynnik całego wykresu , a współczynnikami podplotu są prąd i temperatura roztworu.

Projekt podzielonego poletka ma więcej niż jeden rozmiar jednostki eksperymentalnej . W tym eksperymencie jednostką doświadczalną o jednym rozmiarze jest pojedyncza taśma miedziana. Obróbki lub czynniki, które zastosowano do poszczególnych pasków, to temperatura i prąd roztworu (czynniki te były zmieniane za każdym razem, gdy nowy pasek był umieszczany w roztworze). Druga lub większa jednostka eksperymentalna to zestaw czterech miedzianych pasków. Obróbka lub czynnik zastosowany do zestawu czterech pasków to stężenie roztworu (współczynnik ten został zmieniony po przetworzeniu czterech pasków). Mniejsza jednostka doświadczalna jest nazywana jednostką doświadczalną podpowierzchniową , podczas gdy większa jednostka eksperymentalna jest nazywana całą jednostką poletka .

W tym eksperymencie istnieje 16 poletek eksperymentalnych jednostek. Temperatura roztworu i prąd są czynnikami podplotu w tym eksperymencie. W tym eksperymencie są cztery jednostki doświadczalne na całej powierzchni. Stężenie roztworu jest czynnikiem całego wykresu w tym doświadczeniu. Ponieważ istnieją dwa rozmiary jednostek eksperymentalnych, w modelu występują dwa wyrażenia błędu, jeden, który odpowiada błędowi całego wykresu lub jednostce eksperymentalnej całego wykresu, a drugi odpowiada błędowi częściowego wykresu lub jednostce eksperymentalnej podpowierzchni.

ANOVA stół dla tego eksperymentu będzie wyglądać, w części, w następujący sposób:

Częściowa tabela ANOVA
Źródło DF
Replikacja 1
Stężenie 1
Błąd (cała działka) = powtórzenie × stęż 1
Temperatura 1
Rep × Temp 1
obecny 1
Rep × Bieżąca 1
Temp × Conc 1
Rep × Temp × Conc 1
Temp × Current 1
Rep × Temp × Current 1
Obecne × Stęż 1
Rep × Bieżące × Stęż 1
Temp × Bieżąca × Stęż 1
Error (Subplot) = Rep × Temp × Current × Conc 1

Pierwsze trzy źródła pochodzą z poziomu całego poletka, a kolejnych 12 z części poletka. Normalny wykres prawdopodobieństwa z długoterminowych prognoz 12 subplot mogłyby zostać wykorzystane do poszukiwania statystycznie istotnych kategoriach.

Przykład: proces wsadowy

Rozważ przeprowadzenie eksperymentu w ramach drugiego warunku wymienionego powyżej (tj. Procesu okresowego), w którym cztery paski miedziane są umieszczane w roztworze jednocześnie. Określony poziom prądu można przyłożyć do pojedynczego paska w roztworze. Przeprowadzono te same 16 kombinacji leczenia (powtórzona 2 3 silnia), jakie przeprowadzono w pierwszym scenariuszu. Jednak sposób przeprowadzenia eksperymentu byłby inny. Istnieją cztery kombinacje obróbki temperatury roztworu i stężenia roztworu: (−1, −1), (−1, 1), (1, −1), (1, 1). Eksperymentator losowo wybiera jedną z tych czterech terapii, aby ustawić ją jako pierwszą. W roztworze umieszczono cztery paski miedziane. Dwa z czterech pasków są losowo przypisane do niskiego poziomu prądu. Pozostałe dwa paski są przypisane do wysokiego poziomu prądu. Powłoka jest wykonywana i mierzona jest odpowiedź. Wybiera się drugą kombinację obróbki, obejmującą temperaturę i stężenie, i stosuje się tę samą procedurę. Odbywa się to dla wszystkich czterech kombinacji temperatury / stężenia.

Przeprowadzenie eksperymentu w ten sposób również skutkuje projektem podzielonego wykresu, w którym czynnikami całego wykresu są teraz stężenie roztworu i temperatura roztworu, a współczynnik podpowierzchniowy jest aktualny.

W tym eksperymencie jednostką doświadczalną o jednym rozmiarze jest znowu pojedyncza taśma miedziana. Obróbka lub czynnik zastosowany do poszczególnych pasków jest bieżący (współczynnik ten był każdorazowo zmieniany dla innego paska w roztworze). Drugą lub większą jednostką doświadczalną jest ponownie zestaw czterech miedzianych pasków. Obróbki lub czynniki, które zastosowano do zestawu czterech pasków, to stężenie roztworu i temperatura roztworu (czynniki te zostały zmienione po przetworzeniu czterech pasków).

Jednostka doświadczalna o mniejszym rozmiarze jest ponownie nazywana jednostką doświadczalną podpowierzchniową. W tym eksperymencie istnieje 16 poletek eksperymentalnych jednostek. Prąd jest współczynnikiem subplot w tym eksperymencie.

Większa jednostka eksperymentalna to jednostka eksperymentalna obejmująca całą poletkę. W tym doświadczeniu występują cztery jednostki doświadczalne na całym poletku, a stężenie roztworu i temperatura roztworu są czynnikami całego wykresu w tym doświadczeniu.

Istnieją dwa rozmiary jednostek eksperymentalnych, aw modelu są dwa wyrażenia błędu: jeden, który odpowiada błędowi całego wykresu lub jednostce eksperymentalnej całego wykresu, i drugi, który odpowiada błędowi częściowego wykresu lub jednostce eksperymentalnej podpowierzchni.

ANOVA dla tego eksperymentu wygląda częściowo następująco:

Częściowa tabela ANOVA
Źródło DF
Stężenie 1
Temperatura 1
Błąd (cały wykres) = Stężenie × Temp 1
obecny 1
Conc × Current 1
Temp × Current 1
Conc × Temp × Current 1
Błąd (wykres pomocniczy) 8

Pierwsze trzy źródła pochodzą z poziomu całej działki, a kolejnych 5 z poziomu poletka. Ponieważ istnieje 8 stopni swobody dla składnika błędu podpunktu, to MSE może być używane do testowania każdego efektu, który obejmuje prąd.

Przykład: jednostki eksperymentalne przetwarzane indywidualnie

Rozważ przeprowadzenie eksperymentu zgodnie z trzecim scenariuszem wymienionym powyżej. W roztworze jest tylko jedna taśma miedziana naraz. Jednak dwa paski, jeden przy niskim prądzie i jeden przy wysokim prądzie, są przetwarzane jeden po drugim w tej samej temperaturze i ustawieniu stężenia. Po przetworzeniu dwóch pasków stężenie jest zmieniane, a temperatura jest resetowana do innej kombinacji. Dwa paski są ponownie przetwarzane, jeden po drugim, w tej temperaturze i przy takim ustawieniu stężenia. Proces ten jest kontynuowany do momentu przetworzenia wszystkich 16 taśm miedzianych.

Przeprowadzenie eksperymentu w ten sposób również skutkuje projektem podzielonego wykresu, w którym czynnikami całego wykresu są ponownie stężenie roztworu i temperatura roztworu, a współczynnik podpowierzchniowy jest aktualny. W tym eksperymencie jednostką doświadczalną o jednym rozmiarze jest pojedyncza taśma miedziana. Obróbka lub czynnik zastosowany do poszczególnych pasków jest bieżący (współczynnik ten był każdorazowo zmieniany dla innego paska w roztworze). Druga lub większa jednostka eksperymentalna to zestaw dwóch miedzianych pasków. Obróbki lub czynniki, które zastosowano do pary dwóch pasków, to stężenie roztworu i temperatura roztworu (czynniki te uległy zmianie po przetworzeniu dwóch pasków). Jednostka eksperymentalna o mniejszym rozmiarze jest nazywana jednostką doświadczalną podpowierzchniową.

W tym eksperymencie istnieje 16 poletek eksperymentalnych jednostek. Prąd jest czynnikiem pobocznym w eksperymencie. W tym eksperymencie jest osiem jednostek doświadczalnych na całej powierzchni. Stężenie roztworu i temperatura roztworu to czynniki całego wykresu. W modelu występują dwa składniki błędu, jeden, który odpowiada błędowi całego wykresu lub jednostce eksperymentalnej całego wykresu, a drugi odpowiada błędowi podpunktu lub jednostce eksperymentalnej podpunktu.

ANOVA dla tego (trzeciego) podejścia jest częściowo następująca:

Częściowa tabela ANOVA
Źródło DF
Stężenie 1
Temperatura 1
Conc * Temp 1
Błąd (cała działka) 4
obecny 1
Conc × Current 1
Temp × Current 1
Conc × Temp × Current 1
Błąd (wykres pomocniczy) 4

Pierwsze cztery wyrazy pochodzą z analizy całego wykresu, a następnych 5 z analizy podplotu. Zauważ, że mamy oddzielne składniki błędu zarówno dla całego wykresu, jak i dla efektów podplotu, każdy oparty na 4 stopniach swobody.

Jak widać z tych trzech scenariuszy, jedną z głównych różnic między projektami podzielonego wykresu a prostymi planami czynnikowymi jest liczba różnych rozmiarów jednostek eksperymentalnych w eksperymencie. Projekty podzielonego wykresu mają więcej niż jeden rozmiar jednostki eksperymentalnej, tj. Więcej niż jeden składnik błędu. Ponieważ te plany obejmują różne wielkości jednostek eksperymentalnych i różne wariancje, błędy standardowe różnych porównań średnich obejmują jedną lub więcej wariancji. Określenie odpowiedniego modelu dla projektu podzielonego poletka obejmuje możliwość zidentyfikowania każdego rozmiaru jednostki eksperymentalnej. Sposób, w jaki jednostka eksperymentalna jest definiowana w odniesieniu do struktury projektu (na przykład całkowicie randomizowany projekt w porównaniu z randomizowanym projektem pełnego bloku ) i struktury leczenia (na przykład pełna silnia 2 3 , rozdzielczość V połowa ułamka, dwu- sposób, struktura leczenia z grupą kontrolną itp.). W wyniku posiadania jednostki eksperymentalnej większej niż jeden rozmiar, odpowiednim modelem używanym do analizy planów podzielonych działek jest model mieszany .

Jeśli dane z eksperymentu są analizowane z tylko jednym błędem użytym w modelu, z wyników można wyciągnąć mylące i nieprawidłowe wnioski.

Projekty działek paskowych

Podobnie jak w przypadku schematu podzielonego wykresu, wykres paskowy może wystąpić, gdy podczas eksperymentu wystąpił pewien rodzaj ograniczonej randomizacji. Prosty projekt czynnikowy może skutkować planem pasmowym w zależności od tego, jak przeprowadzono eksperyment. Plany pasmowe często wynikają z eksperymentów przeprowadzanych na dwóch lub więcej etapach procesu, w których każdy etap procesu jest procesem wsadowym, tj. Ukończenie każdej kombinacji obróbki w eksperymencie wymaga więcej niż jednego etapu przetwarzania z jednostkami doświadczalnymi przetwarzanymi razem w każdym procesie krok. Podobnie jak w przypadku schematu podzielonego wykresu, wykresy pasmowe powstają, gdy randomizacja w eksperymencie została w jakiś sposób ograniczona. W wyniku ograniczonej randomizacji, która występuje w projektach paskowych, istnieje wiele rozmiarów jednostek eksperymentalnych. Dlatego istnieją różne terminy błędów lub różne wariancje błędów, które są używane do testowania czynników będących przedmiotem zainteresowania w projekcie. Tradycyjny projekt pasków ma trzy rozmiary jednostek eksperymentalnych.

Przykład wykresu paskowego: dwa kroki i trzy zmienne czynnikowe

Rozważmy następujący przykład z branży półprzewodników. Eksperyment wymaga wszczepienia implantu i wyżarzania. Zarówno na etapie wyżarzania, jak i implantacji należy przetestować trzy czynniki. Proces implantacji obejmuje 12 płytek w partii, a wszczepienie pojedynczej płytki w określonych warunkach jest niepraktyczne ani nie stanowi ekonomicznego użycia implantu. Piec do wyżarzania może obsłużyć do 100 wafli.

Ustawienia dla dwupoziomowego projektu czynnikowego dla trzech czynników w kroku implantacji są oznaczone (A, B, C), a dwupoziomowy projekt czynnikowy dla trzech czynników w kroku wyżarzania są oznaczone (D, E, F ). Obecne są również efekty interakcji między czynnikami implantu i czynnikami wyżarzania. Dlatego ten eksperyment zawiera trzy rozmiary jednostek eksperymentalnych, z których każda ma unikalny składnik błędu do szacowania znaczenia efektów.

Aby nadać rzeczywiste znaczenie fizyczne każdej z jednostek eksperymentalnych w powyższym przykładzie, rozważ każdą kombinację kroków implantacji i wyżarzania jako indywidualną płytkę. Partia ośmiu płytek przechodzi najpierw przez etap implantacji. Kombinacja zabiegów 3 z czynnikami A, B i C to pierwszy cykl leczenia implantologicznego. Ten zabieg implantologiczny jest stosowany na wszystkich ośmiu waflach jednocześnie. Po zakończeniu pierwszego leczenia implantologicznego wszczepia się kolejny zestaw ośmiu płytek z kombinacją leczenia 5 czynników A, B i C. Trwa to do momentu implantacji ostatniej partii ośmiu płytek z połączeniem leczenia 6 czynników A, B i C. Po wykonaniu wszystkich ośmiu kombinacji zabiegów czynników implantu rozpoczyna się etap wyżarzania. Pierwszą kombinacją obróbki wyżarzania, którą należy przeprowadzić, jest kombinacja obróbki 5 czynników D, E i F. Ta kombinacja obróbki wyżarzania jest stosowana do zestawu ośmiu płytek, przy czym każdy z tych ośmiu płytek pochodzi z jednej z ośmiu kombinacji leczenia implantologicznego. Po wyżarzeniu tej pierwszej partii płytek, drugą obróbkę wyżarzania stosuje się do drugiej partii ośmiu płytek, przy czym te osiem płytek pochodzi z jednej z ośmiu kombinacji leczenia implantologicznego. Kontynuuje się to do momentu wszczepienia ostatniej partii ośmiu płytek z określoną kombinacją czynników D, E i F.

Przeprowadzenie eksperymentu w ten sposób prowadzi do powstania wykresu paskowego z trzema rozmiarami jednostek doświadczalnych. Zestaw ośmiu płytek, które są wszczepiane razem, jest eksperymentalną jednostką dla czynników implantu A, B i C oraz dla wszystkich ich interakcji. Istnieje osiem jednostek eksperymentalnych dla czynników związanych z implantem. Różne zestawy ośmiu płytek są razem wyżarzane. Ten inny zestaw ośmiu płytek jest jednostką eksperymentalną drugiego rozmiaru i jest jednostką doświadczalną dla czynników wyżarzania D, E i F oraz dla wszystkich ich interakcji. Jednostką doświadczalną trzeciego rozmiaru jest pojedyncza płytka. Jest to jednostka eksperymentalna dla wszystkich efektów interakcji między czynnikami implantu i czynnikami wyżarzania.

W rzeczywistości powyższy opis wykresu paskowego przedstawia jeden blok lub jedno powtórzenie tego eksperymentu. Jeśli eksperyment nie zawiera replikacji, a model implantu zawiera tylko efekty główne i interakcje dwuczynnikowe, trójczynnikowy składnik interakcji A * B * C (1 stopień swobody) zapewnia składnik błędu do oszacowania skutków w jednostka eksperymentalna implantu. Przywołanie podobnego modelu dla jednostki doświadczalnej wyżarzania daje trójczynnikowy składnik interakcji D * E * F dla składnika błędu (1 stopień swobody) dla efektów w jednostce doświadczalnej wyżarzania.

Zobacz też

Bibliografia

Dalsza lektura

Bardziej szczegółowe omówienie tych projektów i odpowiednich procedur analizy można znaleźć w:

  • Milliken, GA; Johnson, DE (1984). Analiza niechlujnych danych . 1 . Nowy Jork: Van Nostrand Reinhold.
  • Miller, A. (1997). „Konfiguracja wykresu paskowego dla silni ułamkowych”. Technometria . 39 (2): 153–161. doi : 10.2307 / 1270903 . JSTOR   1270903 .

Zewnętrzne linki

 Ten artykuł zawiera materiały należące do  domeny publicznej z witryny internetowej National Institute of Standards and Technology https://www.nist.gov .