Blokowanie (statystyki) - Blocking (statistics)

W statystycznym teorii projektowaniu eksperymentów , blokowanie jest rozmieszczanie urządzeń doświadczalnych w grupach (bloki), które są podobne do siebie.

Posługiwać się

Blokowanie zmniejsza niewyjaśnioną zmienność. Jego zasada polega na tym, że zmienność, której nie można przezwyciężyć (np. potrzeba dwóch partii surowca do wyprodukowania 1 pojemnika substancji chemicznej) jest mylona lub aliasowana z interakcją (n) (wyższego/najwyższego rzędu) w celu wyeliminowania jej wpływu na produkt końcowy. Oddziaływania wysokiego rzędu mają zwykle najmniejsze znaczenie (pomyśl o tym, że temperatura reaktora lub wsad surowców jest ważniejsza niż ich kombinacja - dotyczy to zwłaszcza sytuacji, gdy więcej (3, 4, ...) czynniki są obecne); dlatego lepiej jest pomylić tę zmienność z wyższą interakcją.

Przykłady

  • Mężczyzna i Kobieta : Eksperyment ma na celu przetestowanie nowego leku na pacjentach. Istnieją dwa poziomy leczenia, lek i placebo , podawane pacjentom płci męskiej i żeńskiej w podwójnie ślepej próbie. Płeć pacjenta jest czynnikiem blokującym zmienność leczenia między mężczyznami i kobietami . Zmniejsza to źródła zmienności, a tym samym prowadzi do większej precyzji.
  • Elewacja : Eksperyment ma na celu przetestowanie wpływu nowego pestycydu na konkretny skrawek trawy. Obszar trawiasty zawiera znaczną zmianę wysokości, a zatem składa się z dwóch odrębnych regionów – „wysokiego wzniesienia” i „niskiego wzniesienia”. Grupę leczoną (nowy pestycyd) i grupę placebo stosuje się zarówno na wysoko wzniesionych, jak i nisko wzniesionych obszarach trawy. W tym przypadku badacz blokuje czynnik wzrostu, który może tłumaczyć zmienność stosowania pestycydu.
  • Interwencja : Załóżmy, że wynaleziono proces, który ma na celu wydłużenie podeszwy butów, i opracowano plan przeprowadzenia próby terenowej. Biorąc pod uwagę grupę n ochotników, jednym z możliwych projektów byłoby przyznanie n/2 butów z nowymi podeszwami i n/2 butów ze zwykłymi podeszwami, losowo przydzielając dwa rodzaje podeszew. Ten rodzaj eksperymentu jest projektem całkowicie losowym . Obie grupy są następnie proszone o używanie butów przez pewien czas, a następnie zmierzenie stopnia zużycia podeszew. Jest to wykonalny projekt eksperymentalny, ale wyłącznie z punktu widzenia dokładności statystycznej (pomijając wszelkie inne czynniki), lepszym projektem byłoby przyznanie każdej osobie jednej zwykłej i jednej nowej podeszwy, losowo przypisując oba typy do lewej i odpowiedni but każdego wolontariusza. Taki projekt nazywany jest „randomizowanym, kompletnym projektem blokowym ”. Ten projekt będzie bardziej czuły niż pierwszy, ponieważ każda osoba działa jako jego własna grupa kontrolna, a zatem grupa kontrolna jest ściślej dopasowana do grupy leczonej .

Projekt bloku losowego

W statystycznej teorii projektowania eksperymentów blokowanie to układanie jednostek doświadczalnych w grupy (bloki), które są do siebie podobne. Zazwyczaj czynnik blokujący jest źródłem zmienności, która nie jest głównym przedmiotem zainteresowania eksperymentatora. Przykładem czynnika blokującego może być płeć pacjenta; blokując płeć, kontroluje się to źródło zmienności, co prowadzi do większej dokładności.

W teorii prawdopodobieństwa metoda bloków polega na podzieleniu próbki na bloki (grupy) oddzielone mniejszymi podblokami, dzięki czemu bloki można uznać za prawie niezależne. Metoda bloków pomaga dowieść twierdzeń granicznych w przypadku zależnych zmiennych losowych.

Metodę bloków wprowadził S. Bernstein : Metoda została z powodzeniem zastosowana w teorii sum zależnych zmiennych losowych oraz w teorii wartości ekstremalnych .

Blokowanie stosowane w przypadku uciążliwych czynników, które można kontrolować

Kiedy możemy kontrolować czynniki uciążliwe, można użyć ważnej techniki zwanej blokowaniem, aby zmniejszyć lub wyeliminować wkład w błąd eksperymentalny wnoszony przez czynniki uciążliwe. Podstawową koncepcją jest tworzenie jednorodnych bloków, w których czynniki uciążliwości są utrzymywane na stałym poziomie, a czynnik będący przedmiotem zainteresowania może się zmieniać. W ramach bloków możliwa jest ocena wpływu różnych poziomów interesującego nas czynnika bez martwienia się o zmienność wynikającą ze zmian czynników bloku, które są uwzględniane w analizie.

Definicja czynników blokujących

Czynnik uciążliwy jest używany jako czynnik blokujący, jeśli każdy poziom czynnika podstawowego występuje taką samą liczbę razy na każdym poziomie czynnika uciążliwego. Analiza eksperymentu skupi się na wpływie różnych poziomów czynnika głównego w każdym bloku eksperymentu.

Zablokuj kilka najważniejszych uciążliwych czynników

Ogólna zasada to:

„Zablokuj, co możesz; losuj to, czego nie możesz”.

Blokowanie służy do usuwania skutków kilku najważniejszych uciążliwych zmiennych. Następnie stosuje się randomizację w celu zmniejszenia zanieczyszczających skutków pozostałych uciążliwych zmiennych. W przypadku ważnych, uciążliwych zmiennych, blokowanie przyniesie większe znaczenie interesujących zmiennych niż randomizacja.

Stół

Jednym z przydatnych sposobów spojrzenia na losowy eksperyment blokowy jest rozważenie go jako zbioru całkowicie losowych eksperymentów, z których każdy jest przeprowadzany w ramach jednego z bloków całego eksperymentu.

Randomizowane projekty bloków (RBD)
Nazwa projektu Liczba czynników k Liczba przebiegów n
2-czynnikowy RBD 2 L 1 * l 2
3-czynnikowy RBD 3 L 1 * l 2 * L 3
4-czynnikowy RBD 4 L 1 * l 2 * L 3 * L 4
współczynnik k RBD k L 1 * L 2 * * L k

z

L 1 = liczba poziomów (ustawień) współczynnika 1
L 2 = liczba poziomów (ustawień) współczynnika 2
L 3 = liczba poziomów (ustawień) współczynnika 3
L 4 = liczba poziomów (ustawień) współczynnika 4
L k = liczba poziomów (ustawień) współczynnika k

Przykład

Załóżmy, że inżynierowie w zakładzie produkującym półprzewodniki chcą sprawdzić, czy różne dawki materiału na implant waflowy mają znaczący wpływ na pomiary rezystywności po procesie dyfuzji zachodzącym w piecu. Mają cztery różne dawki, które chcą wypróbować, i wystarczającą liczbę eksperymentalnych wafli z tej samej partii, aby uruchomić trzy wafle w każdej z dawek.

Uciążliwym czynnikiem, którym się zajmują, jest „przebieg pieca”, ponieważ wiadomo, że każdy przebieg pieca różni się od poprzedniego i wpływa na wiele parametrów procesu.

Idealnym sposobem przeprowadzenia tego eksperymentu byłoby uruchomienie wszystkich wafli 4x3=12 w tym samym cyklu pieca. To całkowicie wyeliminowałoby uciążliwy czynnik pieca. Jednak pierwsze wafle produkcyjne mają pierwszeństwo w piecu i tylko kilka wafli doświadczalnych jest dopuszczonych do pracy w dowolnym piecu w tym samym czasie.

Niezablokowanym sposobem przeprowadzenia tego eksperymentu byłoby uruchomienie każdego z dwunastu eksperymentalnych wafli w losowej kolejności, po jednym na cykl pieca. Zwiększyłoby to błąd doświadczalny każdego pomiaru rezystywności przez zmienność między cyklami pieca i utrudniłoby badanie skutków różnych dawek. Zablokowanym sposobem przeprowadzenia tego eksperymentu, zakładając, że można przekonać produkcję do umożliwienia umieszczenia czterech eksperymentalnych wafli w jednym przebiegu pieca, byłoby umieszczenie czterech wafli o różnych dawkach w każdym z trzech przebiegów pieca. Jedyną randomizacją byłby wybór, który z trzech wafli z dawką 1 przejdzie do przebiegu pieca 1 i podobnie dla wafli z dawką 2, 3 i 4.

Opis eksperymentu

Niech X 1 będzie „poziomem” dawki, a X 2 będzie czynnikiem blokującym pracę pieca. Wtedy eksperyment można opisać w następujący sposób:

k = 2 czynniki (1 czynnik pierwotny X 1 i 1 czynnik blokujący X 2 )
L 1 = 4 poziomy czynnika X 1
L 2 = 3 poziomy czynnika X 2
n = 1 replikacja na komórkę
N = L 1 * L 2 = 4 * 3 = 12 przebiegów

Przed randomizacją badania projektowe wyglądają następująco:

X 1 X 2
1 1
1 2
1 3
2 1
2 2
2 3
3 1
3 2
3 3
4 1
4 2
4 3

Reprezentacja macierzowa

Alternatywnym sposobem podsumowania prób projektowych byłoby użycie macierzy 4x3, której 4 wiersze są poziomami obróbki X 1 , a kolumny 3 poziomami zmiennej blokującej X 2 . Komórki w macierzy mają indeksy, które pasują do powyższych kombinacji X 1 , X 2 .

Leczenie Blok 1 Blok 2 Blok 3
1 1 1 1
2 1 1 1
3 1 1 1
4 1 1 1

Należy zauważyć, że próby dla dowolnego projektu bloku randomizowanego ze współczynnikiem K są po prostu wskaźnikami komórkowymi k- wymiarowej macierzy.

Model

Model dla losowego projektu bloku z jedną uciążliwą zmienną to

gdzie

Y ij to dowolna obserwacja, dla której X 1 = i oraz X 2 = j
X 1 jest głównym czynnikiem
X 2 to czynnik blokujący
μ to ogólny parametr lokalizacji (tj. średnia)
T i jest efektem bycia w leczeniu i (czynnika X 1 )
B j jest efektem bycia w bloku j (czynnika X 2 )

Szacunki

Oszacowanie dla μ : = średnia ze wszystkich danych
Oszacowanie dla T i  : z = średnia ze wszystkich Y, dla których X 1 = i .
Oszacowanie dla B j  : z = średnia ze wszystkich Y, dla których X 2 = j .

Uogólnienia

Podstawy teoretyczne

Teoretyczną podstawą blokowania jest następujący wynik matematyczny. Biorąc pod uwagę zmienne losowe, X i Y

Różnica pomiędzy leczenia i kontroli może być więc podane minimalnej wariancji (to znaczy precyzja maksymalnie) przez maksymalizację kowariancji (lub korelacji) między X i Y .

Zobacz też

Bibliografia

Bibliografia