Analiza wrażliwości oparta na wariancji - Variance-based sensitivity analysis

Analiza wrażliwości oparta na wariancji (często określana jako metoda Sobola lub indeksy Sobola , za Ilya M. Sobol ) jest formą globalnej analizy wrażliwości . Działając w ramach probabilistycznych , rozkłada wariancję wyniku modelu lub systemu na ułamki, które można przypisać do danych wejściowych lub zbiorów danych wejściowych. Na przykład, biorąc pod uwagę model z dwoma wejściami i jednym wyjściem, można by stwierdzić, że 70% wariancji wyjściowej jest spowodowane przez wariancję w pierwszym wejściu, 20% przez wariancję w drugim, a 10% z powodu interakcji między dwa. Te wartości procentowe są bezpośrednio interpretowane jako miary wrażliwości. Miary wrażliwości oparte na wariancji są atrakcyjne, ponieważ mierzą czułość w całej przestrzeni wejściowej (tj. Jest to metoda globalna), mogą radzić sobie z odpowiedziami nieliniowymi i mogą mierzyć wpływ interakcji w systemach nieaddytywnych .

Rozkład wariancji

Z perspektywy czarnej skrzynki każdy model można postrzegać jako funkcję Y = f ( X ), gdzie X jest wektorem d niepewnych danych wejściowych modelu { X 1 , X 2 , ... X d }, a Y jest wybranym dane wyjściowe modelu jednowymiarowego (należy zauważyć, że podejście to bada wyniki modelu skalarnego, ale wiele wyników można analizować za pomocą wielu niezależnych analiz wrażliwości). Ponadto zakłada się, że dane wejściowe są niezależnie i równomiernie rozłożone w hipersześcianie jednostkowym, tj . Dla . Nie powoduje to utraty ogólności, ponieważ dowolna przestrzeń wejściowa może zostać przekształcona w ten hipersześcian jednostki. f ( X ) można rozłożyć w następujący sposób,

gdzie f 0 jest stałą, a f i jest funkcją X i , f ij funkcją X i i X j , itd. Warunkiem tego rozkładu jest to, że:

tj. wszystkie terminy w rozkładzie funkcjonalnym są ortogonalne . Prowadzi to do definicji terminów rozkładu funkcjonalnego w kategoriach warunkowych wartości oczekiwanych,

Z której można zauważyć, że f i jest efektem zmiennych X i sam (znany jako główny efekt z X í ) i f ij jest efektem różnej X I i X j jednocześnie dodatkowy do efektu ich indywidualnych wariacje . Nazywa się to interakcją drugiego rzędu . Terminy wyższego rzędu mają analogiczne definicje.

Teraz, zakładając dalej, że f ( X ) jest całkowalne do kwadratu , rozkład funkcjonalny można podnieść do kwadratu i scałkować, aby otrzymać:

Zauważ, że lewa strona jest równa wariancji Y , a wyrazy po prawej stronie są wyrażeniami wariancji, teraz rozłożonymi na zbiory X i . To ostatecznie prowadzi do dekompozycji wyrażenia wariancji,

gdzie

,

i tak dalej. X ~ ja notacja oznacza zbiór wszystkich zmiennych z wyjątkiem X í . Powyższa dekompozycja wariancji pokazuje, w jaki sposób wariancję wyniku modelu można rozłożyć na terminy przypisywane każdemu wejściu, a także efekty interakcji między nimi. Razem wszystkie warunki sumują się do całkowitej wariancji wyniku modelu.

Indeksy pierwszego rzędu

Bezpośrednia miara wrażliwości S i oparta na wariancji , zwana „wskaźnikiem wrażliwości pierwszego rzędu” lub „wskaźnikiem efektu głównego”, jest określona w następujący sposób:

Jest to udział w wariancji wyjściowej efektu głównego X i , dlatego mierzy on efekt samej zmiany X i , ale uśredniony ze zmianami innych parametrów wejściowych. Jest znormalizowany przez całkowitą wariancję, aby zapewnić udział ułamkowy. Indeksy interakcji wyższego rzędu S ij , S ijk i tak dalej można utworzyć, dzieląc inne wyrazy w rozkładzie wariancji przez Var ( Y ). Zwróć uwagę, że ma to konsekwencję,

Wskaźnik całkowitego efektu

Korzystając z podanych powyżej wskaźników S i , S ij oraz wyższego rzędu, można zbudować obraz ważności każdej zmiennej przy określaniu wariancji wyjściowej. Jednak gdy liczba zmiennych jest duża, wymaga to oceny wskaźników 2 d -1, co może być zbyt wymagające obliczeniowo. Z tego powodu stosowana jest miara znana jako „wskaźnik całkowitego efektu” lub „wskaźnik całkowitego porządku”, S Ti . Mierzy wkład w wariancję wyjściową X i , w tym wszystkie wariancje spowodowane jego interakcjami, dowolnego rzędu, z innymi zmiennymi wejściowymi. Jest podany jako

Zauważ, że w przeciwieństwie do S i ,

ze względu na fakt, że efekt interakcji między np. X i i X j jest liczony zarówno w S Ti, jak i S Tj W rzeczywistości suma S Ti będzie równa 1 tylko wtedy, gdy model jest czysto addytywny .

Obliczanie indeksów

W przypadku funkcji wykonalnych analitycznie powyższe wskaźniki można obliczyć analitycznie, oceniając całki w rozkładzie. Jednak w zdecydowanej większości przypadków są one szacowane - najczęściej dokonuje się tego metodą Monte Carlo .

Sekwencje próbkowania

Przykład konstrukcji macierzy A B i z d = 3 i N = 4.

Podejście Monte Carlo polega na wygenerowaniu sekwencji losowo rozmieszczonych punktów wewnątrz hipersześcianu jednostkowego (ściśle mówiąc będą to pseudolosowe ). W praktyce powszechne jest zastępowanie ciągów losowych sekwencjami o małej rozbieżności w celu poprawy wydajności estymatorów. Jest to znane jako metoda quasi-Monte Carlo . Niektóre sekwencje o niskiej rozbieżności, powszechnie stosowane w analizie wrażliwości, obejmują sekwencję Sobola i łaciński projekt hipersześcianu .

Procedura

Aby obliczyć wskaźniki metodą (quasi) Monte Carlo, stosuje się następujące kroki:

  1. Wygeneruj macierz próbki N × 2 d , tj. Każdy wiersz jest punktem próbkowania w hiperprzestrzeni o wymiarach 2 d . Należy to zrobić w odniesieniu do rozkładów prawdopodobieństwa zmiennych wejściowych.
  2. Używać pierwszych d kolumny macierzy w macierzy A , a z pozostałych d kolumny w macierzy B . W efekcie daje to dwie niezależne próbki N punktów w hipersześcianie jednostek wymiarowych d .
  3. Zbuduj d kolejnych macierzy N × d A B i , dla i = 1,2, ..., d, tak aby i- ta kolumna A B i była równa i- tej kolumnie z B , a pozostałe kolumny pochodzą z .
  4. , B i d B i matryc w sumie określić N ( d + 2) punktów w przestrzeni wejściowej (jeden dla każdego rzędu). Uruchom model w każdym punkcie projektowym w macierzach A , B i A B i , uzyskując w sumie N ( d +2) ocen modelu - odpowiadające im f ( A ), f ( B ) if ( A B i ) wartości.
  5. Oblicz wskaźniki wrażliwości przy użyciu poniższych estymatorów.

Dokładność estymatorów jest oczywiście zależna od N . Wartość N można wybrać poprzez sekwencyjne dodawanie punktów i obliczanie wskaźników, aż oszacowane wartości osiągną pewną akceptowalną zbieżność. Z tego powodu przy korzystaniu z sekwencji o małej rozbieżności może być korzystne użycie tych, które pozwalają na sekwencyjne dodawanie punktów (takich jak sekwencja Sobola), w porównaniu z tymi, które tego nie robią (na przykład sekwencje hipersześcianu łacińskiego).

Estymatory

Dla obu indeksów dostępnych jest kilka możliwych estymatorów Monte Carlo. Dwa, które są obecnie w powszechnym użyciu, to:

i

do oszacowania odpowiednio S i i S Ti .

Koszt obliczeniowy

Do oszacowania S i i S Ti dla wszystkich zmiennych wejściowych wymagane są przebiegi modelu N ( d +2). Ponieważ N często jest rzędu setek lub tysięcy uruchomień, koszt obliczeniowy może szybko stać się problemem, gdy model zajmuje dużo czasu na jedno uruchomienie. W takich przypadkach dostępnych jest wiele technik zmniejszających koszt obliczeniowy szacowania wskaźników czułości, takich jak emulatory , HDMR i FAST .

Zobacz też

Bibliografia