Ważona średnia arytmetyczna - Weighted arithmetic mean

Średnia ważona jest podobna do zwykłej średniej arytmetycznej (najczęstszy typ średni ), z tym że zamiast każdego z punktów danych przyczyniających się jednakowo do finału średnia, niektóre punkty danych przyczyni się bardziej niż inni. Pojęcie średniej ważonej odgrywa rolę w statystyce opisowej, a także występuje w bardziej ogólnej formie w kilku innych obszarach matematyki.

Jeśli wszystkie wagi są równe, to średnia ważona jest taka sama jak średnia arytmetyczna . Chociaż średnie ważone generalnie zachowują się w podobny sposób do średnich arytmetycznych, mają kilka sprzecznych z intuicją właściwości, co ujmuje na przykład paradoks Simpsona .

Przykłady

Podstawowy przykład

Biorąc pod uwagę dwie klasy szkolne jedną z 20 uczniami, drugą z 30 uczniami i oceny testu w każdej klasie w następujący sposób:

Lekcja poranna = {62, 67, 71, 74, 76, 77, 78, 79, 79, 80, 80, 81, 81, 82, 83, 84, 86, 89, 93, 98}

Zajęcia popołudniowe = {81, 82, 83, 84, 85, 86, 87, 87, 88, 88, 89, 89, 89, 90, 90, 90, 90, 91, 91, 91, 92, 92, 93, 93, 94, 95, 96, 97, 98, 99}

Średnia zajęć porannych wynosi 80, a zajęć popołudniowych 90. Nieważona średnia z tych dwóch średnich wynosi 85. Nie uwzględnia to jednak różnicy w liczbie uczniów w każdej klasie (20 w porównaniu z 30); stąd wartość 85 nie odzwierciedla średniej oceny ucznia (niezależnie od klasy). Średnią ocenę studenta można uzyskać uśredniając wszystkie oceny, bez względu na zajęcia (zsumuj wszystkie oceny i podziel przez łączną liczbę uczniów):

Można to również osiągnąć, ważąc średnie klasy przez liczbę uczniów w każdej klasie. Większa klasa otrzymuje więcej „wagi”:

Zatem średnia ważona umożliwia znalezienie średniej średniej ocen ucznia bez znajomości wyniku każdego ucznia. Potrzebne są tylko średnie klasy i liczba uczniów w każdej klasie.

Przykład kombinacji wypukłej

Ponieważ istotne są tylko wagi względne , każdą średnią ważoną można wyrazić za pomocą współczynników, które sumują się do jednego. Taka kombinacja liniowa nazywana jest kombinacją wypukłą .

Korzystając z poprzedniego przykładu otrzymalibyśmy następujące wagi:

Następnie zastosuj wagi w ten sposób:

Definicja matematyczna

Formalnie, średnia ważona niepusty skończonej MultiSet danych z odpowiednimi nieujemne wagi jest

który rozszerza się do:

Dlatego elementy danych o dużej wadze mają większy udział w średniej ważonej niż elementy o niskiej wadze. Wagi nie mogą być ujemne. Niektóre mogą być zerami, ale nie wszystkie (ponieważ dzielenie przez zero jest niedozwolone).

Formuły są uproszczone, gdy wagi są znormalizowane w taki sposób, że sumują się do , tj.:

.

Dla takich znormalizowanych wag średnia ważona wynosi zatem:

.

Zauważ, że zawsze można znormalizować wagi, dokonując następującej transformacji na oryginalnych wagach:

.

Użycie znormalizowanej wagi daje takie same wyniki, jak przy użyciu oryginalnych wag:

Zwykła średnia jest szczególnym przypadkiem średnią ważoną, gdzie wszystkie dane mają jednakowe wagi.

Jeżeli elementy danych są niezależnymi i identycznie rozłożonymi zmiennymi losowymi z wariancją , błąd standardowy średniej ważonej , , można wykazać poprzez propagację niepewności jako:

Właściwości statystyczne

Oczekiwanie

Ważona średnia próby , sama jest zmienną losową. Jego wartość oczekiwana i odchylenie standardowe są powiązane z wartościami oczekiwanymi i odchyleniami standardowymi obserwacji w następujący sposób. Dla uproszczenia przyjmujemy wagi znormalizowane (wagi sumujące się do jednego).

Jeśli obserwacje mają oczekiwane wartości

to średnia ważona próbki ma wartość oczekiwaną

W szczególności, jeśli średnie są równe, to oczekiwaniem średniej ważonej próby będzie ta wartość,

Zmienność

Prosty przypadek iid

Traktując wagi jako stałe i mając próbkę n obserwacji z nieskorelowanych zmiennych losowych , wszystkie o tej samej wariancji i oczekiwaniu (jak w przypadku iid zmiennych losowych), wariancję średniej ważonej można oszacować jako mnożenie wariancji przez efekt projektowy Kisha (patrz dowód ):

Z , , i

Oszacowanie to jest jednak dość ograniczone ze względu na silne założenie dotyczące obserwacji y . Doprowadziło to do opracowania alternatywnych, bardziej ogólnych estymatorów.

Perspektywa próbkowania ankiet

Z perspektywy opartej na modelu interesuje nas oszacowanie wariancji średniej ważonej, gdy różne zmienne losowe nie są id . Alternatywną perspektywą dla tego problemu jest pewien arbitralny projekt próbkowania danych, w którym jednostki są wybierane z nierównym prawdopodobieństwem (z podmianą).

W metodologii ankiety średnia populacji pewnej ilości będącej przedmiotem zainteresowania y jest obliczana poprzez oszacowanie sumy y dla wszystkich elementów w populacji ( Y lub czasami T ) i podzielenie jej przez wielkość populacji – albo znana ( ) lub szacunkowe ( ). W tym kontekście każda wartość y jest uważana za stałą, a zmienność wynika z procedury selekcji. Jest to w przeciwieństwie do podejść „opartych na modelu”, w których losowość jest często opisana w wartościach y. Próbkowania Badanie procedura daje szereg Bernoulliego wartości wskaźnika ( ), która dostaje 1 jeśli niektóre obserwacje i znajduje się w próbce i 0, jeśli nie została wybrana. Może to mieć miejsce w przypadku próbkowania o stałej lub zróżnicowanej wielkości próby (np. próbkowanie Poissona ). Prawdopodobieństwo wybrania jakiegoś elementu w danej próbie jest oznaczone jako , a prawdopodobieństwo wyboru jednego losowania to (jeśli N jest bardzo duże i każdy jest bardzo mały). Dla poniższego wyprowadzenia przyjmiemy, że prawdopodobieństwo wybrania każdego elementu jest w pełni reprezentowane przez te prawdopodobieństwa. Np.: wybranie jakiegoś elementu nie wpłynie na prawdopodobieństwo narysowania innego elementu (nie dotyczy to takich rzeczy jak projektowanie próbkowania skupień ).

Ponieważ każdy element ( ) jest stały, a losowość wynika z włączenia go do próby lub nie ( ), często mówimy o mnożeniu tych dwóch, które jest zmienną losową. Aby uniknąć zamieszania w poniższej sekcji, nazwijmy ten termin: . Z następującym oczekiwaniem: ; i wariancja: .

Gdy każdy element próbki jest zawyżony o odwrotność jego prawdopodobieństwa wyboru, nazywamy go rozszerzonymi wartościami y , tj.: . Powiązana ilość to -rozszerzone wartości y : . Jak powyżej, możemy dodać znacznik, jeśli pomnożymy przez funkcję wskaźnika. Tj:

W tej perspektywie projektowej wagi użyte w liczniku średniej ważonej uzyskuje się z odwrotności prawdopodobieństwa wyboru (tj. współczynnika inflacji). Czyli: .

Wariancja sumy ważonej ( pwr - estymator dla sum)

Jeśli znana jest wielkość populacji N , możemy oszacować średnią populacji za pomocą .

Jeśli plan próbkowania to taki, który skutkuje stałą wielkością próby n (np. próbkowanie pps ), wówczas wariancja tego estymatora wynosi:


[Dowód]

Ogólny wzór można opracować w następujący sposób:

Sumę populacji oznaczono jako i można ją oszacować za pomocą (bezstronnego) estymatora Horvitza–Thompsona , zwanego także -estymatorem. Ten estymator można oszacować za pomocą estymatora pwr -estymator (tj.: -rozszerzony o estymator zastępczy lub estymator "prawdopodobieństwo z zamianą"). W powyższym zapisie jest to: .

Szacowana wariancja estymatora pwr jest dana wzorem:

gdzie .

Powyższy wzór zaczerpnięto z Sarndal et. glin. (1992) (również zaprezentowany w Cochran 1977), ale został napisany inaczej. Lewa strona to sposób zapisu wariancji, a prawa strona to sposób, w jaki opracowaliśmy wersję ważoną:

I dotarliśmy do formuły z góry.

Alternatywny termin, kiedy próba ma wielkość próby losowej (jak w próbie Poissona ), jest przedstawiona w Sarndal i in. glin. (1992) jako:

Z . Również gdzie jest prawdopodobieństwo wybrania zarówno i, jak i j. Oraz , oraz dla i=j: .

Jeśli prawdopodobieństwo wyboru nie jest skorelowane (np. ) i zakładając, że prawdopodobieństwo każdego elementu jest bardzo małe, to:

[Dowód]

Zakładamy, że i to

Wariancja średniej ważonej ( π - estymator dla średniej ilorazowej)

Poprzednia sekcja dotyczyła szacowania średniej populacji jako stosunku szacunkowej sumy populacji ( ) do znanej wielkości populacji ( ), a wariancję oszacowano w tym kontekście. Innym częstym przypadkiem jest to, że sama wielkość populacji ( ) jest nieznana i jest szacowana na podstawie próby (np . ). Estymację można opisać jako sumę wag. Więc kiedy dostaniemy . Używając notacji z poprzednich rozdziałów, stosunek, na którym nam zależy, to suma s i jedynek. Czyli: . Możemy to oszacować na naszej próbce za pomocą: . Gdy przeszliśmy od używania N do używania n, w rzeczywistości wiemy, że wszystkie zmienne wskaźnikowe mają wartość 1, więc możemy po prostu napisać: . Będzie to oszacowanie dla określonych wartości y i w, ale właściwości statystyczne pojawiają się po uwzględnieniu zmiennej wskaźnikowej .

Nazywa się to estymatorem współczynnika i jest w przybliżeniu bezstronne dla R .

W tym przypadku zmienność relacji zależy od zmienności zmiennych losowych zarówno w liczniku, jak i mianowniku – oraz ich korelacji. Ponieważ nie ma zamkniętej formy analitycznej do obliczenia tej wariancji, do przybliżonej estymacji stosuje się różne metody. Przede wszystkim linearyzacja pierwszego rzędu serii Taylora , asymptotyka i bootstrap/scyzoryk. Metoda linearyzacji Taylora może prowadzić do niedoszacowania wariancji ogólnie dla małych rozmiarów próbek, ale to zależy od złożoności statystyki. W przypadku średniej ważonej przybliżona wariancja powinna być stosunkowo dokładna nawet dla średniej wielkości próby. W przypadku gdy próbkowanie ma wielkość próby losowej (jak w próbkowaniu Poissona ), wygląda to następująco:

.

Zauważmy, że jeśli , to albo użycie albo dałoby ten sam estymator, ponieważ pomnożenie przez jakiś czynnik doprowadziłoby do tego samego estymatora. Oznacza to również, że jeśli przeskalujemy sumę wag tak, aby była równa znanej wielkości populacji N , obliczenie wariancji wyglądałoby tak samo. Gdy wszystkie wagi są sobie równe, wzór ten jest redukowany do standardowego nieobciążonego estymatora wariancji.

[Dowód]

Linearyzacja Taylora mówi, że dla ogólnego estymatora ilorazowego dwóch sum ( ) można je rozwinąć wokół wartości rzeczywistej R i dać:

A wariancję można przybliżyć przez:

.

Termin jest szacowaną kowariancją między szacowaną sumą Y i szacowaną sumą Z. Ponieważ jest to kowariancja dwóch sum zmiennych losowych , zawierałby wiele kombinacji kowariancji, które będą zależeć od zmiennych wskaźnikowych. Jeśli prawdopodobieństwo wyboru nie jest skorelowane (tj. ), termin ten nadal zawierałby sumę n kowariancji dla każdego elementu i pomiędzy i . Pomaga to zilustrować, że ten wzór uwzględnia wpływ korelacji między y i z na wariancję estymatorów współczynnika.

Definiując powyższe staje się:

.

Jeżeli prawdopodobieństwo wyboru nie jest skorelowane (np. ) i przy założeniu, że prawdopodobieństwo każdego elementu jest bardzo małe (np.: ), to powyższe sprowadza się do następującego:

.

Podobne odtworzenie dowodu (z pewnymi błędami na końcu) zapewnił Thomas Lumley w crossvalidated.



Mamy (co najmniej) dwie wersje wariancji dla średniej ważonej: jedną ze znanym oszacowaniem wielkości populacji i drugą z nieznanym oszacowaniem wielkości populacji. Nie ma jednostajnie lepszego podejścia, ale literatura przedstawia kilka argumentów przemawiających za stosowaniem wersji estymacji populacji (nawet gdy wielkość populacji jest znana). Na przykład: jeśli wszystkie wartości y są stałe, estymator o nieznanej wielkości populacji da poprawny wynik, podczas gdy ten o znanej wielkości populacji będzie miał pewną zmienność. Ponadto, gdy sama wielkość próby jest losowa (np. w próbkowaniu Poissona ), wersja z nieznaną średnią populacji jest uważana za bardziej stabilną. Wreszcie, jeśli proporcja próbkowania jest ujemnie skorelowana z wartościami (tj.: mniejsza szansa na wylosowanie dużej obserwacji), wówczas wersja o nieznanej wielkości populacji nieznacznie to kompensuje.


Walidacja ładowania początkowego

Wykazał to Gatz i in. glin. (1995), że w porównaniu do metod ładowania początkowego , następujące (oszacowanie wariancji średniej ilorazowej z wykorzystaniem linearyzacji szeregiem Taylora ) jest rozsądnym oszacowaniem dla kwadratu błędu standardowego średniej (w kontekście pomiaru składników chemicznych) :

gdzie . Dalsze uproszczenie prowadzi do:

Gatz i in. glin. wspominają, że powyższy preparat został opublikowany przez Endlich et. glin. (1988) traktując średnią ważoną jako kombinację ważonego całkowitego estymatora podzielonego przez estymator wielkości populacji, w oparciu o formułę opublikowaną przez Cochrana (1977), jako przybliżenie do średniej stosunku. Jednak Endlich i in. glin. wydawali się nie publikować tego wyprowadzenia w swoim artykule (chociaż wspominają, że go używali), a książka Cochrana zawiera nieco inne sformułowanie. Mimo to jest prawie identyczny z formułami opisanymi w poprzednich sekcjach.

Estymatory oparte na replikacji

Ponieważ nie ma zamkniętej formy analitycznej dla wariancji średniej ważonej, w literaturze zaproponowano oparcie się na metodach replikacji, takich jak Jackknife i Bootstrapping .


Inne notatki

W przypadku obserwacji nieskorelowanych z wariancjami wariancja średniej ważonej próbki wynosi

którego pierwiastek kwadratowy można nazwać błędem standardowym średniej ważonej (przypadek ogólny) .

W konsekwencji, jeśli wszystkie obserwacje mają równą wariancję, , ważona średnia próbki będzie miała wariancję

gdzie . Wariancja osiąga maksymalną wartość , gdy wszystkie wagi z wyjątkiem jednej wynoszą zero. Jego minimalna wartość jest znaleziona, gdy wszystkie wagi są równe (tj. średnia nieważona), w takim przypadku mamy , czyli degeneruje się do błędu standardowego średniej , do kwadratu.

Należy zauważyć, że ponieważ zawsze można przekształcić wagi nieznormalizowane w wagi znormalizowane, wszystkie formuły w tej sekcji można dostosować do wag nieznormalizowanych, zastępując all .

Wystąpienia przy użyciu średniej ważonej

Wagi wariancji

W przypadku średniej ważonej listy danych, dla których każdy element potencjalnie pochodzi z innego rozkładu prawdopodobieństwa ze znaną wariancją , przy czym wszystkie mają tę samą średnią, jeden możliwy wybór wag wynika z odwrotności wariancji:

Średnia ważona w tym przypadku to:

a błąd standardowy średniej ważonej (z wagami wariancji) wynosi:

Zauważ, że zmniejsza się to do kiedy wszystko . Jest to szczególny przypadek wzoru ogólnego z poprzedniej sekcji,

Powyższe równania można połączyć, aby otrzymać:

Znaczenie tego wyboru polega na tym, że ta średnia ważona jest estymatorem największej wiarygodności średniej rozkładów prawdopodobieństwa przy założeniu, że są one niezależne i mają rozkład normalny z tą samą średnią.

Korygowanie nadmiernej lub niedostatecznej dyspersji

Średnie ważone są zwykle używane do znalezienia średniej ważonej danych historycznych, a nie teoretycznie wygenerowanych danych. W takim przypadku wystąpi błąd w wariancji każdego punktu danych. Zazwyczaj błędy eksperymentalne mogą być niedoszacowane, ponieważ eksperymentator nie bierze pod uwagę wszystkich źródeł błędów przy obliczaniu wariancji każdego punktu danych. W takim przypadku należy skorygować wariancję średniej ważonej, aby uwzględnić fakt, że jest zbyt duża. Korekta, którą należy wprowadzić, to:

gdzie jest zredukowane chi-kwadrat :

Pierwiastek kwadratowy można nazwać błędem standardowym średniej ważonej (wagi wariancji, skorygowana skala) .

Gdy wszystkie wariancje danych są równe , anulują się one w ważonej średniej wariancji , co ponownie sprowadza się do błędu standardowego średniej (kwadrat) , sformułowanego jako odchylenie standardowe próbki (kwadrat),

Pojęcia pokrewne

Ważona wariancja próbki

Zazwyczaj podczas obliczania średniej ważne jest, aby znać wariancję i odchylenie standardowe tej średniej. Gdy stosuje się średnią ważoną , wariancja próbki ważonej różni się od wariancji próbki nieważonej.

Dociskany ważonych próbek wariancja jest określony podobnie jak w przypadku zwykłego tendencyjnego próbki wariancji :

gdzie dla znormalizowanych wag. Jeżeli wagi są wagami częstości (a zatem są zmiennymi losowymi), można wykazać, że jest to estymator największego prawdopodobieństwa dla obserwacji gaussowskich iid .

W przypadku małych próbek zwyczajowo stosuje się nieobciążony estymator wariancji populacji. W normalnych próbkach nieważonych, N w mianowniku (odpowiadające wielkości próbki) zmienia się na N  − 1 (patrz poprawka Bessela ). W ustawieniu ważonym istnieją w rzeczywistości dwa różne nieobciążone estymatory, jeden dla przypadku wag częstotliwości, a drugi dla przypadku wag niezawodności .

Wagi częstotliwości

Jeśli wagi są wagami częstotliwości (gdzie waga jest równa liczbie wystąpień), to bezobciążonym estymatorem jest:

To skutecznie stosuje poprawkę Bessela dla wag częstotliwości.

Na przykład, jeśli wartości są pobierane z tego samego rozkładu, to możemy potraktować ten zbiór jako próbkę nieważoną lub potraktować go jako próbkę ważoną o odpowiednich wagach i tak i tak otrzymamy ten sam wynik.

Jeżeli wagi częstotliwości są znormalizowane do 1, to poprawnym wyrażeniem po korekcie Bessela staje się

gdzie całkowita liczba próbek to (nie ). W każdym razie informacja o całkowitej liczbie próbek jest niezbędna w celu uzyskania obiektywnej korekty, nawet jeśli ma inne znaczenie niż waga częstotliwości.

Należy zauważyć, że estymator może być bezstronny tylko wtedy, gdy wagi nie są wystandaryzowane ani znormalizowane , procesy te zmieniają średnią i wariancję danych, a tym samym prowadzą do utraty wskaźnika bazowego (liczba populacji, która jest wymagana do korekty Bessela).

Wagi niezawodności

Jeśli wagi są zamiast tego nielosowe ( wagi wiarygodności ), możemy określić współczynnik korekcji, aby uzyskać bezstronny estymator. Zakładając, że każda zmienna losowa jest próbkowana z tego samego rozkładu ze średnią i rzeczywistą wariancją , biorąc pod uwagę nasze oczekiwania,

gdzie i . Dlatego obciążenie w naszym estymatorze jest analogiczne do obciążenia w estymatorze nieważonym (zauważ również, że jest to efektywna wielkość próby ). Oznacza to, że aby odciążyć nasz estymator, musimy wstępnie podzielić przez , zapewniając, że oczekiwana wartość oszacowanej wariancji jest równa rzeczywistej wariancji rozkładu próbkowania.

Ostateczne bezstronne oszacowanie wariancji próby to:

gdzie .

Stopnie swobody ważonej, nieobciążonej wariancji próbki różnią się odpowiednio od N  -1 do 0.

Odchylenie standardowe to po prostu pierwiastek kwadratowy z powyższej wariancji.

Na marginesie opisano inne podejścia do obliczania ważonej wariancji próby.

Ważona kowariancja próbki

W próbie ważonej każdemu wektorowi wierszowemu (każdemu zestawowi pojedynczych obserwacji każdej z K zmiennych losowych) przypisywana jest waga .

Wtedy wektor średniej ważonej jest podany przez

A ważona macierz kowariancji jest dana wzorem:

Podobnie jak w przypadku ważonej wariancji próby, istnieją dwa różne nieobciążone estymatory w zależności od rodzaju wag.

Wagi częstotliwości

Jeżeli wagi są wagami częstości , nieobciążone oszacowanie ważone macierzy kowariancji , z poprawką Bessela, wyraża się wzorem:

Należy zauważyć, że ten estymator może być bezstronny tylko wtedy, gdy wagi nie są znormalizowane ani znormalizowane , procesy te zmieniają średnią i wariancję danych, a tym samym prowadzą do utraty wskaźnika bazowego (liczba populacji, która jest wymagana do korekty Bessela).

Wagi niezawodności

W przypadku wag niezawodnościowych wagi są znormalizowane :

(Jeśli nie, podziel wagi przez ich sumę, aby znormalizować przed obliczeniem :

Następnie wektor średniej ważonej można uprościć do

a nieobciążone oszacowanie ważone macierzy kowariancji wynosi:

Rozumowanie tutaj jest takie samo jak w poprzedniej sekcji.

Ponieważ zakładamy, że wagi są znormalizowane, to sprowadza się to do:

Jeśli wszystkie wagi są takie same, tj. , to średnia ważona i kowariancja zmniejszają się do nieważonej średniej próbki i kowariancji powyżej.

Szacunki o wartościach wektorowych

Powyższe można łatwo uogólnić na przypadek przyjęcia średniej z oszacowań o wartościach wektorowych. Na przykład oszacowania pozycji na płaszczyźnie mogą mieć mniej pewności w jednym kierunku niż w innym. Podobnie jak w przypadku skalarnym, średnia ważona wielu oszacowań może zapewnić oszacowanie maksymalnego prawdopodobieństwa . Po prostu zastąpić wariancji przez macierz kowariancji i arytmetycznej odwrotności przez odwrotność macierzy (obydwa oznaczone w ten sam sposób, za pomocą indeksu górnego); następnie macierz wag brzmi:

Średnia ważona w tym przypadku to:

(gdzie rząd iloczynu macierz-wektor nie jest przemienny ), pod względem kowariancji średniej ważonej:

Rozważmy na przykład średnią ważoną punktu [1 0] z dużą wariancją drugiej składowej i [0 1] z dużą wariancją pierwszej składowej. Następnie

wtedy średnia ważona wynosi:

co ma sens: oszacowanie [1 0] jest „zgodne” w drugim komponencie, a oszacowanie [0 1] jest zgodne w pierwszym komponencie, więc średnia ważona wynosi prawie [1 1].

Rachunkowość korelacji

W ogólnym przypadku załóżmy, że , jest macierzą kowariancji odnoszącą się do wielkości , jest wspólną średnią do oszacowania i jest macierzą projektu równą wektorowi jedynek (o długości ). Twierdzenie Gaussa-Markowa stwierdza, że ​​oszacowanie średniej o minimalnej wariancji jest podane przez:

oraz

gdzie:

Zmniejszająca się siła interakcji

Rozważ szeregi czasowe zmiennej niezależnej i zmiennej zależnej , z obserwacjami próbkowanymi w dyskretnych czasach . W wielu powszechnych sytuacjach wartość czasu zależy nie tylko od jego przeszłych wartości, ale także od jego wartości. Zwykle siła tej zależności maleje wraz ze wzrostem separacji obserwacji w czasie. Aby zamodelować tę sytuację, można zastąpić zmienną niezależną jej średnią przesuwną dla rozmiaru okna .

Wykładniczo malejące wagi

W scenariuszu opisanym w poprzednim podrozdziale najczęściej spadek siły interakcji podlega ujemnemu prawu wykładniczemu. Jeśli obserwacje są pobierane w równych odstępach czasu, wówczas wykładniczy spadek jest równoważny zmniejszeniu o stały ułamek w każdym kroku czasowym. Ustawienie możemy zdefiniować znormalizowane wagi wg

gdzie jest sumą nieznormalizowanych wag. W tym przypadku jest po prostu

zbliża się do dużych wartości .

Stała tłumienia musi odpowiadać faktycznemu zmniejszeniu siły oddziaływania. Jeżeli nie można tego określić na podstawie rozważań teoretycznych, to przy dokonywaniu odpowiedniego wyboru przydatne są następujące właściwości wykładniczo malejących wag: w kroku , waga jest w przybliżeniu równa , powierzchnia ogona wartość , powierzchnia głowy . Ogon na kroku to . Tam, gdzie liczą się przede wszystkim najbliższe obserwacje, a efekt pozostałych obserwacji można bezpiecznie zignorować, należy wybrać taki, aby obszar ogona był wystarczająco mały.

Średnie ważone funkcji

Pojęcie średniej ważonej można rozszerzyć na funkcje. Średnie ważone funkcji odgrywają ważną rolę w systemach ważonego rachunku różniczkowego i całkowego.

Zobacz też

Bibliografia

Dalsza lektura

  • Bevington, Filip R (1969). Redukcja danych i analiza błędów dla nauk fizycznych . Nowy Jork, NY: McGraw-Hill. OCLC  300283069 .
  • Strutz, T. (2010). Dopasowanie danych i niepewność (praktyczne wprowadzenie do ważonych najmniejszych kwadratów i nie tylko) . Vieweg+Teubner. Numer ISBN 978-3-8348-1022-9.

Zewnętrzne linki