Blokowanie (statystyki) - Blocking (statistics)
W statystycznym teorii projektowaniu eksperymentów , blokowanie jest rozmieszczanie urządzeń doświadczalnych w grupach (bloki), które są podobne do siebie.
Posługiwać się
Blokowanie zmniejsza niewyjaśnioną zmienność. Jego zasada polega na tym, że zmienność, której nie można przezwyciężyć (np. potrzeba dwóch partii surowca do wyprodukowania 1 pojemnika substancji chemicznej) jest mylona lub aliasowana z interakcją (n) (wyższego/najwyższego rzędu) w celu wyeliminowania jej wpływu na produkt końcowy. Oddziaływania wysokiego rzędu mają zwykle najmniejsze znaczenie (pomyśl o tym, że temperatura reaktora lub wsad surowców jest ważniejsza niż ich kombinacja - dotyczy to zwłaszcza sytuacji, gdy więcej (3, 4, ...) czynniki są obecne); dlatego lepiej jest pomylić tę zmienność z wyższą interakcją.
Przykłady
- Mężczyzna i Kobieta : Eksperyment ma na celu przetestowanie nowego leku na pacjentach. Istnieją dwa poziomy leczenia, lek i placebo , podawane pacjentom płci męskiej i żeńskiej w podwójnie ślepej próbie. Płeć pacjenta jest czynnikiem blokującym zmienność leczenia między mężczyznami i kobietami . Zmniejsza to źródła zmienności, a tym samym prowadzi do większej precyzji.
- Elewacja : Eksperyment ma na celu przetestowanie wpływu nowego pestycydu na konkretny skrawek trawy. Obszar trawiasty zawiera znaczną zmianę wysokości, a zatem składa się z dwóch odrębnych regionów – „wysokiego wzniesienia” i „niskiego wzniesienia”. Grupę leczoną (nowy pestycyd) i grupę placebo stosuje się zarówno na wysoko wzniesionych, jak i nisko wzniesionych obszarach trawy. W tym przypadku badacz blokuje czynnik wzrostu, który może tłumaczyć zmienność stosowania pestycydu.
- Interwencja : Załóżmy, że wynaleziono proces, który ma na celu wydłużenie podeszwy butów, i opracowano plan przeprowadzenia próby terenowej. Biorąc pod uwagę grupę n ochotników, jednym z możliwych projektów byłoby przyznanie n/2 butów z nowymi podeszwami i n/2 butów ze zwykłymi podeszwami, losowo przydzielając dwa rodzaje podeszew. Ten rodzaj eksperymentu jest projektem całkowicie losowym . Obie grupy są następnie proszone o używanie butów przez pewien czas, a następnie zmierzenie stopnia zużycia podeszew. Jest to wykonalny projekt eksperymentalny, ale wyłącznie z punktu widzenia dokładności statystycznej (pomijając wszelkie inne czynniki), lepszym projektem byłoby przyznanie każdej osobie jednej zwykłej i jednej nowej podeszwy, losowo przypisując oba typy do lewej i odpowiedni but każdego wolontariusza. Taki projekt nazywany jest „randomizowanym, kompletnym projektem blokowym ”. Ten projekt będzie bardziej czuły niż pierwszy, ponieważ każda osoba działa jako jego własna grupa kontrolna, a zatem grupa kontrolna jest ściślej dopasowana do grupy leczonej .
Projekt bloku losowego
W statystycznej teorii projektowania eksperymentów blokowanie to układanie jednostek doświadczalnych w grupy (bloki), które są do siebie podobne. Zazwyczaj czynnik blokujący jest źródłem zmienności, która nie jest głównym przedmiotem zainteresowania eksperymentatora. Przykładem czynnika blokującego może być płeć pacjenta; blokując płeć, kontroluje się to źródło zmienności, co prowadzi do większej dokładności.
W teorii prawdopodobieństwa metoda bloków polega na podzieleniu próbki na bloki (grupy) oddzielone mniejszymi podblokami, dzięki czemu bloki można uznać za prawie niezależne. Metoda bloków pomaga dowieść twierdzeń granicznych w przypadku zależnych zmiennych losowych.
Metodę bloków wprowadził S. Bernstein : Metoda została z powodzeniem zastosowana w teorii sum zależnych zmiennych losowych oraz w teorii wartości ekstremalnych .
Blokowanie stosowane w przypadku uciążliwych czynników, które można kontrolować
Kiedy możemy kontrolować czynniki uciążliwe, można użyć ważnej techniki zwanej blokowaniem, aby zmniejszyć lub wyeliminować wkład w błąd eksperymentalny wnoszony przez czynniki uciążliwe. Podstawową koncepcją jest tworzenie jednorodnych bloków, w których czynniki uciążliwości są utrzymywane na stałym poziomie, a czynnik będący przedmiotem zainteresowania może się zmieniać. W ramach bloków możliwa jest ocena wpływu różnych poziomów interesującego nas czynnika bez martwienia się o zmienność wynikającą ze zmian czynników bloku, które są uwzględniane w analizie.
Definicja czynników blokujących
Czynnik uciążliwy jest używany jako czynnik blokujący, jeśli każdy poziom czynnika podstawowego występuje taką samą liczbę razy na każdym poziomie czynnika uciążliwego. Analiza eksperymentu skupi się na wpływie różnych poziomów czynnika głównego w każdym bloku eksperymentu.
Zablokuj kilka najważniejszych uciążliwych czynników
Ogólna zasada to:
- „Zablokuj, co możesz; losuj to, czego nie możesz”.
Blokowanie służy do usuwania skutków kilku najważniejszych uciążliwych zmiennych. Następnie stosuje się randomizację w celu zmniejszenia zanieczyszczających skutków pozostałych uciążliwych zmiennych. W przypadku ważnych, uciążliwych zmiennych, blokowanie przyniesie większe znaczenie interesujących zmiennych niż randomizacja.
Stół
Jednym z przydatnych sposobów spojrzenia na losowy eksperyment blokowy jest rozważenie go jako zbioru całkowicie losowych eksperymentów, z których każdy jest przeprowadzany w ramach jednego z bloków całego eksperymentu.
Nazwa projektu | Liczba czynników k | Liczba przebiegów n |
---|---|---|
2-czynnikowy RBD | 2 | L 1 * l 2 |
3-czynnikowy RBD | 3 | L 1 * l 2 * L 3 |
4-czynnikowy RBD | 4 | L 1 * l 2 * L 3 * L 4 |
współczynnik k RBD | k | L 1 * L 2 * * L k |
z
- L 1 = liczba poziomów (ustawień) współczynnika 1
- L 2 = liczba poziomów (ustawień) współczynnika 2
- L 3 = liczba poziomów (ustawień) współczynnika 3
-
L 4 = liczba poziomów (ustawień) współczynnika 4
- L k = liczba poziomów (ustawień) współczynnika k
Przykład
Załóżmy, że inżynierowie w zakładzie produkującym półprzewodniki chcą sprawdzić, czy różne dawki materiału na implant waflowy mają znaczący wpływ na pomiary rezystywności po procesie dyfuzji zachodzącym w piecu. Mają cztery różne dawki, które chcą wypróbować, i wystarczającą liczbę eksperymentalnych wafli z tej samej partii, aby uruchomić trzy wafle w każdej z dawek.
Uciążliwym czynnikiem, którym się zajmują, jest „przebieg pieca”, ponieważ wiadomo, że każdy przebieg pieca różni się od poprzedniego i wpływa na wiele parametrów procesu.
Idealnym sposobem przeprowadzenia tego eksperymentu byłoby uruchomienie wszystkich wafli 4x3=12 w tym samym cyklu pieca. To całkowicie wyeliminowałoby uciążliwy czynnik pieca. Jednak pierwsze wafle produkcyjne mają pierwszeństwo w piecu i tylko kilka wafli doświadczalnych jest dopuszczonych do pracy w dowolnym piecu w tym samym czasie.
Niezablokowanym sposobem przeprowadzenia tego eksperymentu byłoby uruchomienie każdego z dwunastu eksperymentalnych wafli w losowej kolejności, po jednym na cykl pieca. Zwiększyłoby to błąd doświadczalny każdego pomiaru rezystywności przez zmienność między cyklami pieca i utrudniłoby badanie skutków różnych dawek. Zablokowanym sposobem przeprowadzenia tego eksperymentu, zakładając, że można przekonać produkcję do umożliwienia umieszczenia czterech eksperymentalnych wafli w jednym przebiegu pieca, byłoby umieszczenie czterech wafli o różnych dawkach w każdym z trzech przebiegów pieca. Jedyną randomizacją byłby wybór, który z trzech wafli z dawką 1 przejdzie do przebiegu pieca 1 i podobnie dla wafli z dawką 2, 3 i 4.
Opis eksperymentu
Niech X 1 będzie „poziomem” dawki, a X 2 będzie czynnikiem blokującym pracę pieca. Wtedy eksperyment można opisać w następujący sposób:
- k = 2 czynniki (1 czynnik pierwotny X 1 i 1 czynnik blokujący X 2 )
- L 1 = 4 poziomy czynnika X 1
- L 2 = 3 poziomy czynnika X 2
- n = 1 replikacja na komórkę
- N = L 1 * L 2 = 4 * 3 = 12 przebiegów
Przed randomizacją badania projektowe wyglądają następująco:
X 1 | X 2 |
---|---|
1 | 1 |
1 | 2 |
1 | 3 |
2 | 1 |
2 | 2 |
2 | 3 |
3 | 1 |
3 | 2 |
3 | 3 |
4 | 1 |
4 | 2 |
4 | 3 |
Reprezentacja macierzowa
Alternatywnym sposobem podsumowania prób projektowych byłoby użycie macierzy 4x3, której 4 wiersze są poziomami obróbki X 1 , a kolumny 3 poziomami zmiennej blokującej X 2 . Komórki w macierzy mają indeksy, które pasują do powyższych kombinacji X 1 , X 2 .
Leczenie | Blok 1 | Blok 2 | Blok 3 |
---|---|---|---|
1 | 1 | 1 | 1 |
2 | 1 | 1 | 1 |
3 | 1 | 1 | 1 |
4 | 1 | 1 | 1 |
Należy zauważyć, że próby dla dowolnego projektu bloku randomizowanego ze współczynnikiem K są po prostu wskaźnikami komórkowymi k- wymiarowej macierzy.
Model
Model dla losowego projektu bloku z jedną uciążliwą zmienną to
gdzie
- Y ij to dowolna obserwacja, dla której X 1 = i oraz X 2 = j
- X 1 jest głównym czynnikiem
- X 2 to czynnik blokujący
- μ to ogólny parametr lokalizacji (tj. średnia)
- T i jest efektem bycia w leczeniu i (czynnika X 1 )
- B j jest efektem bycia w bloku j (czynnika X 2 )
Szacunki
- Oszacowanie dla μ : = średnia ze wszystkich danych
- Oszacowanie dla T i : z = średnia ze wszystkich Y, dla których X 1 = i .
- Oszacowanie dla B j : z = średnia ze wszystkich Y, dla których X 2 = j .
Uogólnienia
- Uogólnione projekty bloków randomizowanych (GRBD) umożliwiają testowanie interakcji blok-leczenie i mają dokładnie jeden czynnik blokujący, taki jak RCBD.
- Kwadraty łacińskie (i inne układy wiersz-kolumna) mają dwa czynniki blokujące, które, jak się uważa, nie wchodzą w interakcje.
- Próbkowanie hipersześcianu łacińskiego
- Kwadraty grecko-łacińskie
- Hipergraeco-łacińskie wzory kwadratowe
Podstawy teoretyczne
Teoretyczną podstawą blokowania jest następujący wynik matematyczny. Biorąc pod uwagę zmienne losowe, X i Y
Różnica pomiędzy leczenia i kontroli może być więc podane minimalnej wariancji (to znaczy precyzja maksymalnie) przez maksymalizację kowariancji (lub korelacji) między X i Y .
Zobacz też
- Statystyka algebraiczna
- Projekt bloku
- Projekt kombinatoryczny
- Uogólniony losowy projekt bloku
- Słowniczek projektowania eksperymentalnego
- Optymalny projekt
- Sparowany test różnicowy
- Projekt bloku losowego
- Zmienne zależne i niezależne
- Modelowanie blokowe
Bibliografia
- Ten artykuł zawiera materiał domeny publicznej z National Institute of Standards and Technology stronie https://www.nist.gov .
Bibliografia
- Addelman, S. (1969). „Uogólniony losowy projekt bloku”. Statystyk amerykański . 23 (4): 35–36. doi : 10.2307/2681737 . JSTOR 2681737 .
- Addelman, S. (1970). „Zmienność zabiegów i jednostek doświadczalnych w projektowaniu i analizie eksperymentów”. Dziennik Amerykańskiego Towarzystwa Statystycznego . 65 (331): 1095-1108. doi : 10.2307/2284277 . JSTOR 2284277 .
- Anscombe, FJ (1948). „Ważność eksperymentów porównawczych”. Dziennik Królewskiego Towarzystwa Statystycznego . Generał). 111 (3): 181-111. doi : 10.2307/2984159 . JSTOR 2984159 . MR 0030181 .
- Bailey, RA (2008). Projektowanie eksperymentów porównawczych . Wydawnictwo Uniwersytetu Cambridge. Numer ISBN 978-0-521-68357-9. Zarchiwizowane od oryginału w dniu 2018-03-22. Rozdziały przed publikacją są dostępne on-line.
- Bapat, RB (2000). Algebra liniowa i modele liniowe (wyd. drugie). Skoczek. Numer ISBN 978-0-387-98871-9.
- Caliński T. i Kageyama S. (2000). Projekty blokowe: podejście randomizacji, Tom I : Analiza . Notatki z wykładów w statystyce. 150 . Nowy Jork: Springer-Verlag. Numer ISBN 0-387-98578-6.
- Caliński T. i Kageyama S. (2003). Projekty blokowe: podejście randomizacji, Tom II : Projekt . Notatki z wykładów w statystyce. 170 . Nowy Jork: Springer-Verlag. Numer ISBN 0-387-95470-8. MR 1994124 .
- Bramy, CE (listopad 1995). „Czym naprawdę jest błąd eksperymentalny w projektach blokowych?”. Statystyk amerykański . 49 (4): 362–363. doi : 10.2307/2684574 . JSTOR 2684574 .
- Kempthorne, Oscar (1979). The Design and Analysis of Experiments (Poprawiony przedruk (1952) Wiley ed.). Roberta E. Kriegera. Numer ISBN 0-88275-105-0.
-
Hinkelmann, Klaus i Kempthorne, Oscar (2008). Projektowanie i analiza eksperymentów . I i II (wyd. drugie). Wileya. Numer ISBN 978-0-470-38551-7.CS1 maint: wiele nazwisk: lista autorów ( link )
- Hinkelmann, Klaus i Kempthorne, Oscar (2008). Projektowanie i analiza eksperymentów, tom I: Wprowadzenie do projektowania eksperymentalnego (wyd. drugie). Wileya. Numer ISBN 978-0-471-72756-9.CS1 maint: wiele nazwisk: lista autorów ( link )
- Hinkelmann, Klaus i Kempthorne, Oscar (2005). Projekt i analiza eksperymentów, tom 2: Zaawansowany projekt eksperymentalny (wyd. pierwsze). Wileya. Numer ISBN 978-0-471-55177-5.CS1 maint: wiele nazwisk: lista autorów ( link )
- Lenner, Marcin; Thomas Biskup (1993). „Uogólniony projekt RCB (rozdział 6.13)” . Projektowanie i analiza eksperymentów (wyd. drugie). PO Box 884, Blacksburg, VA 24063: Valley Book Company. s. 225-226. Numer ISBN 0-9616255-2-X.CS1 maint: lokalizacja ( link )
- Raghavarao, Damaraju (1988). Konstrukcje i problemy kombinatoryczne w projektowaniu eksperymentów (poprawione przedruk z 1971 Wiley ed.). Nowy Jork: Dover. Numer ISBN 0-486-65685-3.
- Raghavarao, Damaraju i Padgett, LV (2005). Projekty blokowe: analiza, kombinatoryka i zastosowania . Światowy Naukowy. Numer ISBN 981-256-360-1.CS1 maint: wiele nazwisk: lista autorów ( link )
- Shah, Kirti R. i Sinha, Bikas K. (1989). Teoria Projektów Optymalnych . Notatki z wykładów w statystyce . 54 . Springer-Verlag. s. 171+viii. Numer ISBN 0-387-96991-8.
- Ulica, Anna Penfold ; Ulica, Deborah J. (1987). Kombinatoryka projektowania eksperymentalnego . Oxford UP [Clarendon]. Numer ISBN 0-19-853256-3.
- Wilk, MB (1955). „Analiza randomizacji uogólnionego projektu blokowego z randomizacją”. Biometria . 42 (1–2): 70–79. doi : 10.2307/2333423 . JSTOR 2333423 .
- Zyskind, George (1963). „Niektóre konsekwencje randomizacji w uogólnieniu zrównoważonego niekompletnego projektu blokowego” . Roczniki statystyki matematycznej . 34 (4): 1569-1581. doi : 10.1214/aoms/1177703889 . JSTOR 2238364 .