Eksperyment czynnikowy - Factorial experiment

Zaprojektowane eksperymenty z pełnym planem czynnikowym (po lewej), powierzchnia odpowiedzi z wielomianem drugiego stopnia (po prawej)

W statystyce pełny eksperyment czynnikowy to eksperyment, którego projekt składa się z dwóch lub więcej czynników, z których każdy ma dyskretne możliwe wartości lub „poziomy”, i którego jednostki eksperymentalne przyjmują wszystkie możliwe kombinacje tych poziomów we wszystkich takich czynnikach. Pełny plan czynnikowy można również nazwać planem w pełni skrzyżowanym . Taki eksperyment pozwala badaczowi zbadać wpływ każdego czynnika na zmienną odpowiedzi , a także wpływ interakcji między czynnikami na zmienną odpowiedzi.

W większości eksperymentów czynnikowych każdy czynnik ma tylko dwa poziomy. Na przykład, przy dwóch czynnikach, z których każdy przyjmuje dwa poziomy, eksperyment czynnikowy miałby łącznie cztery kombinacje leczenia i jest zwykle nazywany planem czynnikowym 2 × 2 .

Jeżeli liczba kombinacji w pełnym planie czynnikowym jest zbyt duża, aby była logistycznie wykonalna, można wykonać ułamkowy plan czynnikowy , w którym niektóre z możliwych kombinacji (zwykle co najmniej połowa) są pomijane.

Historia

Projekty czynnikowe były używane w XIX wieku przez Johna Benneta Lawesa i Josepha Henry'ego Gilberta z Rothamsted Experimental Station .

Ronald Fisher argumentował w 1926 r., Że „złożone” projekty (takie jak projekty czynnikowe) są bardziej wydajne niż badanie jednego czynnika na raz. Fisher napisał:

„Żaden aforyzm nie jest częściej powtarzany w związku z próbami polowymi, niż to, że musimy zadawać Naturze kilka pytań, a najlepiej jedno pytanie na raz. Pisarz jest przekonany, że ten pogląd jest całkowicie błędny”.

Jak sugeruje, natura najlepiej odpowie na „logiczny i dokładnie przemyślany kwestionariusz”. Projekt czynnikowy pozwala na określenie wpływu kilku czynników, a nawet interakcji między nimi, za pomocą takiej samej liczby prób, jaka jest konieczna do samodzielnego określenia któregokolwiek z efektów z tym samym stopniem dokładności.

Frank Yates wniósł znaczący wkład, szczególnie w analizie projektów, za pomocą analizy Yatesa .

Termin „silnia” mógł nie być używany w druku przed 1935 rokiem, kiedy Fisher użył go w swojej książce The Design of Experiments .

Zalety eksperymentów silniowych

Wiele osób bada wpływ tylko jednego czynnika lub zmiennej. W porównaniu z takimi eksperymentami z jednym czynnikiem w czasie (OFAT), eksperymenty czynnikowe mają kilka zalet

  • Plany czynnikowe są bardziej wydajne niż eksperymenty OFAT. Dostarczają więcej informacji po podobnych lub niższych kosztach. Potrafią znaleźć optymalne warunki szybciej niż eksperymenty OFAT.
  • Obliczenia czynnikowe umożliwiają badanie dodatkowych czynników bez dodatkowych kosztów.
  • Gdy wpływ jednego czynnika jest różny dla różnych poziomów innego czynnika, nie można go wykryć za pomocą projektu eksperymentu OFAT. Do wykrycia takich interakcji wymagane są plany czynnikowe . Użycie OFAT, gdy występują interakcje, może prowadzić do poważnych nieporozumień co do tego, jak reakcja zmienia się z czynnikami.
  • Plany czynnikowe pozwalają oszacować wpływ czynnika na kilku poziomach innych czynników, dając wnioski, które są ważne w szeregu warunków eksperymentalnych.

Przykładowe zalety eksperymentów silniowych

W swojej książce Improving Almost Anything: Ideas and Essays statystyk George Box podaje wiele przykładów korzyści płynących z eksperymentów czynnikowych. Tutaj jest jeden. Inżynierowie producenta łożysk SKF chcieli wiedzieć, czy zmiana na tańszą konstrukcję „koszyka” wpłynie na żywotność łożyska. Inżynierowie poprosili statystykę Christera Hellstranda o pomoc w zaprojektowaniu eksperymentu.

Wykres kostki dla łożyska żywotność.svg

Box podaje następujące informacje. „Wyniki oceniono za pomocą przyspieszonego testu trwałości.… Przebiegi były drogie, ponieważ musiały być wykonane na rzeczywistej linii produkcyjnej, a eksperymentatorzy planowali wykonać cztery serie ze standardową klatką i cztery ze zmodyfikowaną klatką. Christer zapytał, czy były inne czynniki, które chcieliby przetestować. Powiedzieli, że tak, ale wykonanie dodatkowych przebiegów przekroczyłoby ich budżet. Christer pokazał im, jak mogą przetestować dwa dodatkowe czynniki „za darmo” - bez zwiększania liczby przebiegów i bez zmniejszania dokładność ich oszacowania efektu klatki. W tym układzie, zwanym planem silniowym 2 × 2 × 2, każdy z trzech czynników byłby analizowany na dwóch poziomach i obejmowałby wszystkie osiem możliwych kombinacji. Różne kombinacje można dogodnie przedstawić jako wierzchołki sześcianu ... "" W każdym przypadku stan standardowy jest oznaczony znakiem minus, a stan zmodyfikowany znakiem plus. Zmieniono czynniki, takie jak obróbka cieplna, oskulacja pierścienia zewnętrznego i konstrukcja klatki. Liczby pokazują względne długości życia łożysk. Jeśli spojrzysz na [wykres kostki], zobaczysz, że wybór projektu klatki nie zrobił dużej różnicy. … Ale jeśli uśrednisz pary liczb dla projektu klatki, otrzymasz [tabelę poniżej], która pokazuje, co zrobiły dwa inne czynniki. … Doprowadziło to do niezwykłego odkrycia, że ​​w tym konkretnym zastosowaniu żywotność łożyska może wzrosnąć pięciokrotnie, jeśli jednocześnie zwiększą się dwa czynniki: oskulacja pierścienia zewnętrznego i obróbka cieplna pierścienia wewnętrznego ”.

Żywotność łożyska a ciepło i oskulacja
Oskulacja - Osculation +
Ciepło - 18 23
Ciepło + 21 106

„Pamiętając, że łożyska takie jak ten są produkowane od dziesięcioleci, na początku jest zaskakujące, że odkrycie tak ważnej poprawy może zająć tak dużo czasu. Prawdopodobne wyjaśnienie jest takie, ponieważ większość inżynierów do niedawna stosowała tylko jeden czynnik w eksperymentowanie z czasem, efekty interakcji zostały przeoczone ”.

Przykład

Najprostszy eksperyment czynnikowy zawiera dwa poziomy dla każdego z dwóch czynników. Załóżmy, że inżynier chciałby zbadać całkowitą moc zużywaną przez każdy z dwóch różnych silników, A i B, pracujących z dwoma różnymi prędkościami, 2000 lub 3000 obr / min. Eksperyment czynnikowy składałby się z czterech jednostek eksperymentalnych: silnika A przy 2000 obr / min, silnika B przy 2000 obr / min, silnika A przy 3000 obr / min i silnika B przy 3000 obr / min. Każda kombinacja jednego poziomu wybranego z każdego czynnika występuje tylko raz.

Ten eksperyment jest przykładem eksperymentu czynnikowego 2 2 (lub 2 × 2), nazwanego tak, ponieważ bierze pod uwagę dwa poziomy (podstawę) dla każdego z dwóch czynników (potęga lub indeks górny) lub #levels #factors , dając 2 2 = 4 punkty silni.

Wykres kostkowy do projektowania czynnikowego

Projekty mogą obejmować wiele zmiennych niezależnych. Jako kolejny przykład, efekty trzech zmiennych wejściowych można ocenić w ośmiu warunkach eksperymentalnych przedstawionych jako rogi sześcianu.

Można to przeprowadzić z replikacją lub bez, w zależności od jej przeznaczenia i dostępnych zasobów. Zapewni wpływ trzech zmiennych niezależnych na zmienną zależną i możliwe interakcje.

Notacja

Doświadczenie silni 2 × 2
ZA b
(1) - -
za + -
b - +
ab + +

Notacja używana do oznaczania eksperymentów silniowych zawiera wiele informacji. Kiedy projekt jest oznaczony jako silnia 2 3 , oznacza to liczbę czynników (3); ile poziomów ma każdy czynnik (2); i ile warunków eksperymentalnych występuje w projekcie (2 3  = 8). Podobnie, projekt 2 5 ma pięć czynników, każdy z dwoma poziomami i 2 5  = 32 warunki eksperymentalne. Eksperymenty czynnikowe mogą obejmować czynniki o różnej liczbie poziomów. Projekt 2 4 3 ma pięć współczynników, cztery z dwoma poziomami i jeden z trzema poziomami, i ma 16 × 3 = 48 warunków eksperymentalnych.

Aby zaoszczędzić miejsce, punkty w dwupoziomowym eksperymencie silni są często skracane za pomocą ciągów znaków plus i minus. Łańcuchy mają tyle symboli, ile czynników, a ich wartości określają poziom każdego czynnika: konwencjonalnie, dla pierwszego (lub niskiego) poziomu i dla drugiego (lub wysokiego) poziomu. W przypadku tego eksperymentu może być zatem przedstawiane jako , , i .

Punkty silni mogą być również skracane przez (1), a, b i ab, gdzie obecność litery wskazuje, że określony czynnik jest na swoim wysokim (lub drugim) poziomie, a brak litery wskazuje, że określony czynnik jest na swoim niskim (lub pierwszym) poziomie (na przykład „a” wskazuje, że współczynnik A jest ustawiony na wysokim poziomie, podczas gdy wszystkie inne czynniki są na najniższym (lub pierwszym) poziomie). (1) służy do wskazania, że ​​wszystkie czynniki mają najniższe (lub pierwsze) wartości.

Realizacja

W przypadku więcej niż dwóch czynników, eksperyment czynnikowy 2 k można zwykle zaprojektować rekurencyjnie na podstawie eksperymentu czynnikowego 2 k- 1 przez powtórzenie eksperymentu 2 k- 1 , przypisując pierwsze powtórzenie do pierwszego (lub niskiego) poziomu nowego czynnika, a druga replikacja na drugi (lub wysoki) poziom. Ramy te można uogólnić, np. Zaprojektować trzy powtórzenia dla czynników o trzech poziomach itp .

Eksperyment czynnikowy pozwala na oszacowanie błędu eksperymentalnego na dwa sposoby. Eksperyment można powtórzyć lub często można wykorzystać zasadę rzadkości skutków . Replikacja jest bardziej powszechna w przypadku małych eksperymentów i jest bardzo wiarygodnym sposobem oceny błędu eksperymentu. Gdy liczba czynników jest duża (zazwyczaj więcej niż około 5 czynników, ale różni się to w zależności od aplikacji), powtórzenie projektu może stać się operacyjnie trudne. W takich przypadkach powszechne jest uruchamianie tylko jednej kopii planu i założenie, że interakcje czynników większej niż określona kolejność (powiedzmy, między trzema lub więcej czynnikami) są pomijalne. Przy tym założeniu oszacowania takich oddziaływań wyższego rzędu są oszacowaniami dokładnego zera, a więc w rzeczywistości oszacowaniem błędu eksperymentalnego.

W przypadku wielu czynników konieczne będzie przeprowadzenie wielu przebiegów eksperymentalnych, nawet bez replikacji. Na przykład eksperymentowanie z 10 czynnikami na dwóch poziomach, z których każdy daje 2 · 10 = 1024 kombinacji. W pewnym momencie staje się to niewykonalne z powodu wysokich kosztów lub niewystarczających zasobów. W takim przypadku można zastosować ułamkowe plany czynnikowe .

Jak w przypadku każdego eksperymentu statystycznego, biegnie doświadczalne w silni eksperymentu należy losowo do zmniejszenia wpływu, że nastawienie może mieć na podstawie wyników doświadczalnych. W praktyce może to być dużym wyzwaniem operacyjnym.

Eksperymenty czynnikowe można stosować, gdy istnieje więcej niż dwa poziomy każdego czynnika. Jednak liczba serii eksperymentalnych wymaganych do trójpoziomowych (lub więcej) planów czynnikowych będzie znacznie większa niż w przypadku ich dwupoziomowych odpowiedników. Plany czynnikowe są zatem mniej atrakcyjne, jeśli badacz chce wziąć pod uwagę więcej niż dwa poziomy.

Analiza

Eksperyment czynnikowy można analizować za pomocą ANOVA lub analizy regresji . Aby obliczyć efekt główny czynnika „A”, odejmij średnią odpowiedź wszystkich przebiegów eksperymentalnych, dla których A był na niskim (lub pierwszym) poziomie, od średniej odpowiedzi wszystkich przebiegów eksperymentalnych, dla których A był wysoki (lub drugi ) poziom.

Inne przydatne narzędzia badawcze do analizy eksperymentów czynnikowych to główne efekty działki, działki interakcji , wykresy Pareto , a normalny prawdopodobieństwa fabuły szacowanych efektów.

Gdy czynniki są ciągłe, dwupoziomowe plany czynnikowe zakładają, że skutki są liniowe . Jeśli spodziewany jest efekt kwadratowy dla czynnika, należy zastosować bardziej skomplikowane doświadczenie, takie jak centralny projekt kompozytowy . Optymalizacja czynników, które mogą mieć efekt kwadratowy, jest głównym celem metodologii powierzchni odpowiedzi .

Przykład analizy

Montgomery podaje następujący przykład analizy eksperymentu czynnikowego:

Inżynier chciałby zwiększyć szybkość filtracji (wydajność) procesu produkcji substancji chemicznej i zmniejszyć ilość formaldehydu używanego w procesie. Wcześniejsze próby zmniejszenia formaldehydu obniżyły szybkość filtracji. Obecny współczynnik filtracji wynosi 75 galonów na godzinę. Pod uwagę brane są cztery czynniki: temperatura (A), ciśnienie (B), stężenie formaldehydu (C) i szybkość mieszania (D). Każdy z czterech czynników zostanie przetestowany na dwóch poziomach.

Następnie znaki minus (-) i plus (+) będą wskazywać, czy współczynnik jest odpowiednio niski, czy wysoki.

Macierz projektu i wynikająca z tego szybkość filtracji
ZA b do re Szybkość filtracji
- - - - 45
+ - - - 71
- + - - 48
+ + - - 65
- - + - 68
+ - + - 60
- + + - 80
+ + + - 65
- - - + 43
+ - - + 100
- + - + 45
+ + - + 104
- - + + 75
+ - + + 86
- + + + 70
+ + + + 96

Nierównoległe linie na wykresie interakcji A: C wskazują, że wpływ czynnika A zależy od poziomu czynnika C. Podobny wynik zachodzi dla interakcji A: D. Wykresy wskazują, że czynnik B ma niewielki wpływ na współczynnik filtracji. Analizę wariancji (ANOVA), a w tym wszystkie 4 czynników i możliwych interakcji między nimi względem dostarcza estymaty współczynnika pokazane w tabeli poniżej.

Wyniki ANOVA
Współczynniki Oszacowanie
Przechwycić 70.063
ZA 10,813
b 1.563
do 4.938
re 7.313
Odp .: B. 0,063
Odp.: C -9,063
PNE 1.188
OGŁOSZENIE 8.313
B: D −0,188
PŁYTA CD -0,563
ABC 0.938
A: B: D 2.063
Odp.: C: D −0,813
B: C: D −1,313
A: B: C: D 0.688
Wykres Pareto pokazujący względną wielkość współczynników współczynnika.

Ponieważ istnieje 16 obserwacji i 16 współczynników (punkt przecięcia, efekty główne i interakcje), wartości p nie mogą być obliczane dla tego modelu. Wartości współczynników i wykresy sugerują, że ważnymi czynnikami są A, C i D, a warunki interakcji A: C i A: D.

Współczynniki dla A, C i D są wszystkie dodatnie w ANOVA, co sugerowałoby uruchomienie procesu z wszystkimi trzema zmiennymi ustawionymi na wysoką wartość. Jednak głównym efektem każdej zmiennej jest średnia z poziomów innych zmiennych. Powyższy wykres interakcji A: C pokazuje, że wpływ czynnika A zależy od poziomu czynnika C i odwrotnie. Czynnik A (temperatura) ma bardzo mały wpływ na szybkość filtracji, gdy współczynnik C jest na poziomie +. Ale czynnik A ma duży wpływ na szybkość filtracji, gdy czynnik C (formaldehyd) jest na poziomie -. Połączenie A na poziomie + i C na poziomie - daje najwyższy współczynnik filtracji. Ta obserwacja wskazuje, że analizy jednoczynnikowe mogą przeoczyć ważne interakcje. Tylko zmieniając jednocześnie oba czynniki A i C, inżynier mógł odkryć, że wpływ czynnika A zależy od poziomu czynnika C.

Wykres sześcienny dla ANOVA przy użyciu czynników A, C i D oraz warunków interakcji A: C i A: D. Wykres pomaga w wizualizacji wyniku i pokazuje, że najlepszą kombinacją są A +, D + i C−.

Najlepszy współczynnik filtracji jest widoczny, gdy A i D są na wysokim poziomie, a C na niskim. Wynik ten spełnia również cel redukcji formaldehydu (czynnik C). Ponieważ B nie wydaje się być ważny, można go usunąć z modelu. Wykonanie ANOVA przy użyciu czynników A, C i D oraz warunków interakcji A: C i A: D daje wynik przedstawiony w poniższej tabeli, w której wszystkie warunki są istotne (wartość p <0,05).

Wyniki ANOVA
Współczynnik Oszacowanie Standardowy błąd wartość t wartość p
Przechwycić 70.062 1.104 63,444 2,3 x 10-14
ZA 10,812 1.104 9,791 1,9 × 10 −6
do 4.938 1.104 4.471 1,2 x 10-3
re 7.313 1.104 6.622 5,9 x 10-5
Odp.: C -9,063 1.104 −8,206 9,4 x 10 −6
OGŁOSZENIE 8.312 1.104 7.527 2 × 10-5

Zobacz też

Uwagi

Bibliografia

Linki zewnętrzne