Ponowne próbkowanie scyzoryka — Jackknife resampling
W statystykach The jackknife jest resampling technika szczególnie przydatna dla wariancji i stronniczości oszacowania. Nóż składany wyprzedza inne popularne metody ponownego próbkowania, takie jak bootstrap . Estymator parametru scyzoryka znajduje się poprzez systematyczne pomijanie każdej obserwacji ze zbioru danych i obliczenie oszacowania, a następnie znalezienie średniej z tych obliczeń. Biorąc pod uwagę wielkość próbki , oszacowanie scyzoryka znajduje się poprzez agregację oszacowań każdej podpróbki o rozmiarze .
Technika scyzoryka została opracowana przez Maurice'a Quenouille'a (1924-1973) w 1949 i udoskonalona w 1956. John Tukey rozwinął tę technikę w 1958 i zaproponował nazwę „scyzoryk”, ponieważ, podobnie jak fizyczny scyzoryk (kompaktowy składany nóż), jest to proste i gotowe narzędzie, które może improwizować rozwiązanie różnych problemów, nawet jeśli konkretne problemy można skuteczniej rozwiązać za pomocą specjalnie zaprojektowanego narzędzia.
Scyzoryk jest liniowym przybliżeniem bootstrapu .
Oszacowanie
Oszacowanie parametru przez scyzoryk można znaleźć przez oszacowanie parametru dla każdej podpróbki, pomijając i-tą obserwację. Na przykład, jeśli parametrem do oszacowania jest średnia populacji x , obliczamy średnią dla każdej podpróbki składającej się ze wszystkich punktów danych oprócz i :
Te n oszacowań tworzy oszacowanie rozkładu statystyki próby, jeśli została obliczona dla dużej liczby próbek. W szczególności średnia tego rozkładu próbkowania jest średnią z tych n oszacowań:
Można jednoznacznie wykazać, że równa się to zwykłemu oszacowaniu , więc punkt rzeczywisty pojawia się dla momentów wyższych niż średnia. Szacunkowe oszacowanie wariancji estymatora można obliczyć na podstawie wariancji tego rozkładu :
Estymacja i korekta błędu systematycznego
Technikę scyzoryka można wykorzystać do oszacowania obciążenia estymatora obliczonego dla całej próbki. Say jest obliczonym estymatorem interesującego nas parametru na podstawie wszystkich obserwacji. Pozwolić
gdzie jest oszacowanie odsetek na podstawie próbki z í -tej obserwacji usuwane, a to średnia z tych „leave-one-out” szacunków. Oszacowanie odchylenia scyzoryka jest podane przez:
a wynikowe oszacowanie scyzoryka z korekcją odchylenia jest podane przez:
Usuwa to stronniczość w szczególnym przypadku, w którym jest to stronniczość i usuwa ją w innych przypadkach.
Zobacz też
Literatura
- Berger, YG (2007). „Estymator wariancji jackknife dla jednostopniowych warstw warstwowych o nierównych prawdopodobieństwach”. Biometria . 94 (4): 953–964. doi : 10.1093/biomet/asm072 .
- Bergera, YG; Rao, JNK (2006). „Skorygowany scyzoryk do imputacji pod nierównym prawdopodobieństwem pobierania próbek bez wymiany”. Dziennik Królewskiego Towarzystwa Statystycznego, seria B . 68 (3): 531–547. doi : 10.1111/j.1467-9868.2006.00555.x .
- Bergera, YG; Skinner, CJ (2005). „Estymator wariancji jackknife dla nierównego próbkowania prawdopodobieństwa”. Dziennik Królewskiego Towarzystwa Statystycznego, seria B . 67 (1): 79–89. doi : 10.1111/j.1467-9868.2005.00489.x .
- Jiang, J.; Lahiri, P.; Wan, SM. (2002). „Ujednolicona teoria scyzoryka do empirycznego najlepszego przewidywania z M-estymacją” . Roczniki Statystyczne . 30 (6): 1782–810. doi : 10.1214/aos/1043351257 .
- Jones, HL (1974). „Oszacowanie scyzoryka funkcji warstwy średnich”. Biometria . 61 (2): 343–348. doi : 10.2307/2334363 . JSTOR 2334363 .
- Kisz, L.; Frankel, MR (1974). „Wnioskowanie ze złożonych próbek”. Dziennik Królewskiego Towarzystwa Statystycznego, seria B . 36 (1): 1-37.
- Krewski, D.; Rao, JNK (1981). „Wnioskowanie z próbek warstwowych: właściwości linearyzacji, scyzoryka i zrównoważone metody powtarzalnej replikacji” . Roczniki Statystyczne . 9 (5): 1010–1019. doi : 10.1214/aos/1176345580 .
- Quenouille, MH (1956). „Uwagi na temat stronniczości w ocenie”. Biometria . 43 (3–4): 353–360. doi : 10.1093/biomet/43.3-4.353 .
- Rao, JNK; Shao, J. (1992). „Oszacowanie wariancji scyzoryka z danymi pomiarowymi w ramach imputacji gorącego pokładu”. Biometria . 79 (4): 811–822. doi : 10.1093/biomet/79.4.811 .
- Rao, JNK; Wu, CFJ; Yue, K. (1992). „Niedawne prace nad metodami resamplingu dla złożonych ankiet”. Metodologia badania . 18 (2): 209–217.
- Shao, J. i Tu, D. (1995). Scyzoryk i Bootstrap. Springer-Verlag, Inc.
- Tukey, JW (1958). „Odchylenie i zaufanie do niezbyt dużych próbek (abstrakt)”. Roczniki statystyki matematycznej . 29 (2): 614.
- Wu, CFJ (1986). „Knife, Bootstrap i inne metody resamplingu w analizie regresji” (PDF) . Roczniki Statystyczne . 14 (4): 1261-1295. doi : 10.1214/aos/1176350142 .
Uwagi
Bibliografia
- Cameron, Adrian; Trivedi, Pravin K. (2005). Mikroekonometria: metody i zastosowania . Cambridge Nowy Jork: Cambridge University Press. Numer ISBN 9780521848053.
- Efron, Bradley ; Stein, Charles (maj 1981). „Oszacowanie wariancji scyzoryka” . Roczniki Statystyczne . 9 (3): 586–596. doi : 10.1214/aos/1176345462 . JSTOR 2240822 .
- Efron, Bradley (1982). Scyzoryk, bootstrap i inne plany dotyczące ponownego próbkowania . Filadelfia, PA: Towarzystwo Matematyki Przemysłowej i Stosowanej. Numer ISBN 9781611970319.
- Quenouille, Maurice H. (wrzesień 1949). „Problemy z próbkowaniem samolotu” . Roczniki statystyki matematycznej . 20 (3): 355–375. doi : 10.1214/aoms/1177729989 . JSTOR 2236533 .
- Quenouille, Maurice H. (1956). „Uwagi na temat stronniczości w szacowaniu”. Biometria . 43 (3–4): 353–360. doi : 10.1093/biomet/43.3-4.353 . JSTOR 2332914 .
- Tukey, John W. (1958). „Odchylenie i zaufanie w niezbyt dużych próbkach (abstrakt)” . Roczniki statystyki matematycznej . 29 (2): 614. doi : 10.1214/aoms/1177706647 .