Ważenie odwrotnej wariancji — Inverse-variance weighting

W statystykach , odwrotny wariancji ważenie to metoda agregacji dwóch lub więcej losowych zmiennych w celu zminimalizowania wariancji średniej ważonej. Każda zmienna losowa jest ważona odwrotnie proporcjonalnie do jej wariancji, czyli proporcjonalnie do jej precyzji .

Biorąc pod uwagę sekwencję niezależnych obserwacji y i z wariancjami σ i 2 , średnia ważona odwrotnej wariancji jest dana przez

Średnia ważona z odwrotną wariancją ma najmniejszą wariancję spośród wszystkich średnich ważonych, co można obliczyć jako

Jeżeli wszystkie wariancje pomiarów są równe, to średnia ważona z odwrotną wariancją staje się średnią prostą.

Ważenie odwrotnej wariancji jest zwykle stosowane w metaanalizie statystycznej lub fuzji czujników w celu połączenia wyników z niezależnych pomiarów.

Kontekst

Załóżmy, że eksperymentator chce zmierzyć wartość pewnej wielkości, powiedzmy, przyspieszenie ziemskie , którego prawdziwa wartość to . Uważny eksperymentator dokonuje wielu pomiarów, które oznaczamy zmiennymi losowymi . Jeśli wszystkie są zaszumione, ale bezstronne, tj. urządzenie pomiarowe nie przeszacowuje lub nie zaniża systematycznie wartości prawdziwej, a błędy są rozrzucone symetrycznie, wtedy wartość oczekiwana . Rozrzut w pomiarze charakteryzuje się wtedy wariancją zmiennych losowych , a jeśli pomiary są wykonywane w identycznych scenariuszach, to wszystkie są takie same, do czego będziemy się odwoływać przez . Biorąc pod uwagę pomiary, typowy estymator dla , oznaczony jako , jest podany przez prostą średnią . Zauważ, że ta średnia empiryczna jest również zmienną losową, której wartość oczekiwana jest, ale również ma rozrzut. Jeżeli poszczególne pomiary nie są skorelowane, kwadrat błędu oszacowania jest określony wzorem . Stąd, jeśli wszystkie są równe, to błąd w oszacowaniu zmniejsza się wraz ze wzrostem as , co powoduje, że preferowane są dalsze obserwacje.

Zamiast powtarzać pomiary jednym przyrządem, jeśli eksperymentator wykonuje tę samą ilość przy pomocy różnych przyrządów o różnej jakości pomiarów, to nie ma powodu, aby oczekiwać, że różne będą takie same. Niektóre instrumenty mogą być głośniejsze niż inne. W przykładzie pomiaru przyspieszenia ziemskiego, różne "przyrządy" mogą mierzyć z prostego wahadła , z analizy ruchu pocisku itp. Prosta średnia nie jest już optymalnym estymatorem, ponieważ błąd może faktycznie przekroczyć błąd w najmniej zaszumionym pomiarze, jeśli różne pomiary mają bardzo różne błędy. Zamiast odrzucać zaszumione pomiary, które zwiększają błąd końcowy, eksperymentator może połączyć wszystkie pomiary z odpowiednimi wagami, aby nadać większą wagę najmniej zaszumionym pomiarom i odwrotnie. Biorąc pod uwagę wiedzę , optymalnym estymatorem do pomiaru byłaby średnia ważona pomiarów , dla konkretnego doboru wag . Wariancja estymatora , która dla optymalnego doboru wag staje się

Zauważ, że ponieważ estymator ma rozrzut mniejszy niż rozrzut w każdym indywidualnym pomiarze. Ponadto rozrzut maleje wraz z dodawaniem kolejnych pomiarów, jakkolwiek głośniejsze mogą być te pomiary.

Pochodzenie

Rozważmy ogólną sumę ważoną , w której wagi są znormalizowane w taki sposób, że . Jeśli wszystkie są niezależne, wariancja jest dana przez

Dla optymalności chcemy zminimalizować, co można zrobić, przyrównując gradient względem wag do zera, przy jednoczesnym zachowaniu ograniczenia, że . Używając mnożnika Lagrange'a do wymuszenia ograniczenia, wyrażamy wariancję

Dla ,

co oznacza, że

Głównym na wynos jest to . Ponieważ ,

Poszczególne znormalizowane wagi to

Łatwo zauważyć, że to rozwiązanie ekstremum odpowiada minimum z drugiego testu pochodnej cząstkowej, zauważając, że wariancja jest funkcją kwadratową wag. Zatem minimalna wariancja estymatora jest wtedy dana przez

Rozkłady normalne

W przypadku zmiennych losowych o rozkładzie normalnym można również wyprowadzić średnie ważone z odwrotną wariancją jako oszacowanie maksymalnego prawdopodobieństwa dla wartości prawdziwej. Ponadto, z perspektywy bayesowskiej, rozkład a posteriori dla prawdziwej wartości przy obserwacjach o rozkładzie normalnym i płaskiej a priori jest rozkładem normalnym z odwrotną wariancją średniej ważonej jako średnią i wariancją

Przypadek wielowymiarowy

W przypadku rozkładów wielowymiarowych równoważny argument prowadzi do optymalnego ważenia w oparciu o macierze kowariancji poszczególnych oszacowań :

W przypadku rozkładów wielowymiarowych częściej stosuje się termin „precyzyjnie ważona średnia”.

Zobacz też

Bibliografia