Próbka (statystyki) - Sample (statistics)

Wizualna reprezentacja wyboru prostej losowej próbki

W statystyce i metodologii badań ilościowych próba jest zbiorem osób lub obiektów zebranych lub wybranych z populacji statystycznej zgodnie z określoną procedurą. Elementy próbki są znane jako przykładowych punktów , urządzeń pomiarowych lub uwag. W przypadku pojmowania próby jako zbioru danych, próbka jest często oznaczana wielkimi literami alfabetu łacińskiego, takimi jak i , z elementami wyrażonymi małymi literami (np. ), a wielkość próby jest oznaczona literą .

Zazwyczaj populacja jest bardzo duża, co sprawia, że spis lub pełne wyliczenie wszystkich osobników w populacji jest albo niepraktyczne, albo niemożliwe. Próba zwykle reprezentuje podzbiór o możliwej do zarządzania wielkości. Próbki są zbierane, a statystyki są obliczane z próbek, dzięki czemu można wnioskować lub ekstrapolować z próbki na populację.

Próbka może być pobrana z populacji „bez wymiany” (to znaczy nie ma element może być wybrany więcej niż jeden raz w tej samej próbki), w którym to przypadku jest podzbiorem z populacji ; lub „z wymianą” (tzn. element może występować wielokrotnie w jednej próbce), w którym to przypadku jest to zbiór wielu podzbiorów.

Rodzaje próbek

Cała próbka jest zbiorem obiektów z populacji rodzicielskiej, która zawiera wszystkie te obiekty, które spełniają szereg dobrze określonych kryteriów wyboru. Na przykład kompletna próba australijskich mężczyzn o wzroście powyżej 2 m składałaby się z listy wszystkich Australijczyków mężczyzn o wzroście powyżej 2 m. Ale nie obejmowałoby Niemców, wysokich Australijczyków ani ludzi poniżej 2 m. Tak więc, aby skompilować taką kompletną próbę, potrzebna jest pełna lista populacji rodziców, zawierająca dane dotyczące wzrostu, płci i narodowości każdego członka tej populacji rodziców. W przypadku populacji ludzkich jest mało prawdopodobne, aby taka pełna lista istniała (populacja ludzka liczona jest w miliardach). Ale takie kompletne próbki są często dostępne w innych dyscyplinach, takich jak zestaw graczy w głównej lidze sportowej, daty urodzenia członków parlamentu lub pełna lista obiektów astronomicznych o ograniczonej wielkości.

Bezstronna (reprezentatywna) próbka to zbiór obiektów wybrany z pełnej próby przy użyciu procesu selekcji, który nie zależy od właściwości obiektów. Na przykład bezstronna próba australijskich mężczyzn o wzroście powyżej 2 m może składać się z losowo dobranej podgrupy 1% australijskich mężczyzn o wzroście powyżej 2 m. Ale osoba wybrana z rejestru wyborców może nie być bezstronna, ponieważ na przykład mężczyźni w wieku poniżej 18 lat nie znajdą się na liście wyborców. W kontekście astronomicznym próbka bezstronna może składać się z tej części pełnej próbki, dla której dostępne są dane, pod warunkiem, że dostępność danych nie jest obciążona indywidualnymi właściwościami źródła.

Najlepszym sposobem uniknięcia próby tendencyjnej lub niereprezentatywnej jest wybranie próby losowej, zwanej również próbą prawdopodobieństwa. Próba losowa jest definiowana jako próba, w której każdy pojedynczy członek populacji ma znaną, niezerową szansę, że zostanie wybrany jako część próby. Kilka rodzajów próbek losowych są proste losowe próbki , systematyczne próby , warstwowe losowanie próby , a klaster losowe próbki .

Próbka, która nie jest losowa, nazywana jest próbką nielosową lub próbką bez prawdopodobieństwa . Niektóre przykłady próbek przypadkowy są próbki wygody , próbki osądów , próbki celowych , próbki przydziału , próbki śnieżki i węzły kwadraturowe w metodach quasi Monte Carlo .

Matematyczny opis próbki losowej

W ujęciu matematycznym, przy założeniu rozkładu prawdopodobieństwa F , próbka losowa o długości n (gdzie n może być dowolną dodatnią liczbą całkowitą) jest zbiorem realizacji n niezależnych , równomiernie rozłożonych ( iid ) zmiennych losowych o rozkładzie F .

Próbka konkretnie reprezentuje wyniki n eksperymentów, w których mierzy się tę samą ilość. Na przykład, jeśli chcemy oszacować średni wzrost członków określonej populacji, mierzymy wzrost n osobników. Każdy pomiar jest losowany z rozkładu prawdopodobieństwa F charakteryzującego populację, więc każda zmierzona wysokość jest realizacją zmiennej losowej o rozkładzie F . Zauważ, że zbioru zmiennych losowych (tj. zbioru funkcji mierzalnych) nie należy mylić z realizacjami tych zmiennych (które są wartościami, które przyjmują te zmienne losowe). Innymi słowy, jest funkcją reprezentującą pomiar w i-tym eksperymencie i jest wartością uzyskaną podczas dokonywania pomiaru.

Zobacz też

Uwagi

Zewnętrzne linki