Rozkład prawdopodobieństwa - Probability distribution
Część serii o statystykach |
Teoria prawdopodobieństwa |
---|
W teorii prawdopodobieństwa i statystyki , o rozkład prawdopodobieństwa jest matematyczną funkcją , która daje prawdopodobieństwa wystąpienia różnych możliwych wyników dla eksperymentu . Jest to matematyczny opis przypadkowej zjawiska pod względem jej powierzchni próbki oraz prawdopodobieństw o wydarzeniach (podzbiorów przestrzeni próby).
Na przykład, jeśli X jest używane do oznaczenia wyniku rzutu monetą („eksperyment”), wówczas rozkład prawdopodobieństwa X przyjmie wartość 0,5 (1 na 2 lub 1/2) dla X = orły i 0,5 dla X = reszki (przy założeniu, że moneta jest fair ). Przykładami zjawisk losowych są warunki pogodowe w przyszłości, wzrost losowo wybranej osoby, odsetek uczniów płci męskiej w szkole, wyniki ankiety do przeprowadzenia itp.
Wstęp
Rozkład prawdopodobieństwa to matematyczny opis prawdopodobieństw zdarzeń, podzbiorów przestrzeni próbek . Przestrzeń prób, często oznaczana przez , jest zbiorem wszystkich możliwych skutków obserwowanego zjawiska losowego; może to być dowolny zbiór: zbiór liczb rzeczywistych , zbiór wektorów , zbiór dowolnych wartości nieliczbowych itp. Na przykład przestrzeń próbna rzutu monetą to Ω = {orzechy, reszki} .
Aby zdefiniować rozkłady prawdopodobieństwa dla konkretnego przypadku zmiennych losowych (tak, aby przestrzeń próbki była postrzegana jako zbiór liczbowy), często rozróżnia się dyskretne i ciągłe zmienne losowe . W przypadku dyskretnym wystarczy określić funkcję masy prawdopodobieństwa przypisującą prawdopodobieństwo każdemu możliwemu wynikowi: na przykład przy rzucaniu sprawiedliwą kostką każda z sześciu wartości od 1 do 6 ma prawdopodobieństwo 1/6. Prawdopodobieństwo zdarzenia jest następnie definiowane jako suma prawdopodobieństw wyników, które spełniają zdarzenie; na przykład prawdopodobieństwo zdarzenia „na kostce wyrzuci parzystą wartość” wynosi
W przeciwieństwie do tego, gdy zmienna losowa przyjmuje wartości z kontinuum, zazwyczaj każdy pojedynczy wynik ma prawdopodobieństwo zerowe i tylko zdarzenia, które zawierają nieskończenie wiele wyników, takie jak przedziały, mogą mieć prawdopodobieństwo dodatnie. Rozważmy na przykład zmierzenie wagi kawałka szynki w supermarkecie i załóżmy, że waga ma precyzję wielu cyfr. Prawdopodobieństwo, że waży dokładnie 500 g, wynosi zero, ponieważ najprawdopodobniej będzie miał kilka niezerowych cyfr dziesiętnych. Niemniej jednak można by wymagać w kontroli jakości, aby opakowanie szynki „500 g” ważyć od 490 g do 510 g z co najmniej 98% prawdopodobieństwem, a żądanie to jest mniej wrażliwe na dokładność przyrządów pomiarowych.
Ciągłe rozkłady prawdopodobieństwa można opisać na kilka sposobów. Funkcja gęstości prawdopodobieństwa opisuje nieskończenie małe prawdopodobieństwo dowolnej danej wartości, a prawdopodobieństwo, że wynik leży w danym przedziale, można obliczyć, całkując funkcję gęstości prawdopodobieństwa w tym przedziale. Alternatywnym opisem rozkładu jest funkcja skumulowanego rozkładu , która opisuje prawdopodobieństwo, że zmienna losowa nie jest większa niż dana wartość (tj. P ( X < x ) dla niektórych x ). Funkcja rozkładu skumulowanego to obszar pod funkcją gęstości prawdopodobieństwa od do x , jak opisano na rysunku po prawej stronie.
Ogólna definicja
Rozkład prawdopodobieństwa można opisać w różnych postaciach, na przykład za pomocą funkcji masy prawdopodobieństwa lub funkcji rozkładu skumulowanego. Jednym z najbardziej ogólnych opisów, który dotyczy zmiennych ciągłych i dyskretnych, jest użycie funkcji prawdopodobieństwa, której przestrzeń wejściowa jest powiązana z przestrzenią próbki i daje jako wyjście prawdopodobieństwo liczby rzeczywistej .
Funkcja prawdopodobieństwa P może przyjąć jako podzbiory argumentów samej przestrzeni próbek, jak w przykładzie rzutu monetą, gdzie funkcja P została zdefiniowana tak, że P (orzeł) = 0.5 i P (regon) = 0.5 . Jednak ze względu na powszechne stosowanie zmiennych losowych , które przekształcają przestrzeń próby w zbiór liczb (np. , ), częściej bada się rozkłady prawdopodobieństwa, których argumentem są podzbiory tych konkretnych rodzajów zbiorów (zbiorów liczb), i wszystkie rozkłady prawdopodobieństwa omówione w tym artykule są tego typu. Oczywiste jest, w celu określenia, jak P ( X e ), prawdopodobieństwo tego, że pewna zmienna X należy do pewnego zdarzenia E .
Powyższa funkcja prawdopodobieństwa charakteryzuje rozkład prawdopodobieństwa tylko wtedy, gdy spełnia wszystkie aksjomaty Kołmogorowa , czyli:
- , więc prawdopodobieństwo jest nieujemne
- , więc prawdopodobieństwo nie przekracza
- dla każdej rozłącznej rodziny zbiorów
Pojęcie funkcji prawdopodobieństwa jest bardziej rygorystyczne poprzez zdefiniowanie jej jako elementu przestrzeni prawdopodobieństwa , gdzie jest zbiorem możliwych wyników, jest zbiorem wszystkich podzbiorów, których prawdopodobieństwo można zmierzyć i jest funkcją prawdopodobieństwa lub miarą prawdopodobieństwa , który przypisuje prawdopodobieństwo każdemu z tych mierzalnych podzbiorów .
Rozkłady prawdopodobieństwa dzieli się na ogół na dwie klasy. Dyskretny rozkład prawdopodobieństwa jest zastosowanie w sytuacjach, gdy zestaw możliwych realizacji dyskretnych (np monetą, rolkę matrycy) i prawdopodobieństwa są kodowane przez dyskretną liście prawdopodobieństw wyników; w tym przypadku dyskretny rozkład prawdopodobieństwa jest znany jako funkcja masy prawdopodobieństwa . Z drugiej strony, ciągłe rozkłady prawdopodobieństwa mają zastosowanie do scenariuszy, w których zbiór możliwych wyników może przyjmować wartości z zakresu ciągłego (np. liczby rzeczywiste), takie jak temperatura w danym dniu. W przypadku liczb rzeczywistych ciągły rozkład prawdopodobieństwa jest funkcją rozkładu skumulowanego . Ogólnie rzecz biorąc, w przypadku ciągłym, prawdopodobieństwa opisuje funkcja gęstości prawdopodobieństwa , a rozkład prawdopodobieństwa jest z definicji całką funkcji gęstości prawdopodobieństwa. Rozkład normalny to powszechnie spotykany ciągły rozkład prawdopodobieństwa. Bardziej złożone eksperymenty, takie jak te dotyczące procesów stochastycznych definiowanych w czasie ciągłym , mogą wymagać zastosowania bardziej ogólnych miar prawdopodobieństwa .
Rozkład prawdopodobieństwa, którego przestrzeń prób jest jednowymiarowa (na przykład liczby rzeczywiste, lista etykiet, etykiety uporządkowane lub binarny) jest nazywany jednowymiarowym , natomiast rozkład, którego przestrzeń prób jest przestrzenią wektorową o wymiarze 2 lub większym, jest nazywany wielowymiarowym . Rozkład jednowymiarowy podaje prawdopodobieństwa przyjęcia przez pojedynczą zmienną losową różnych wartości; rozkład wielowymiarowy ( łączny rozkład prawdopodobieństwa ) podaje prawdopodobieństwa losowego wektora – listy dwóch lub więcej zmiennych losowych – przyjmujących różne kombinacje wartości. Ważne i powszechnie spotykane rozkłady prawdopodobieństwa jednowymiarowej obejmują rozkład dwumianowy , o dystrybucję hipergeometryczny , a rozkład normalny . Powszechnie spotykanym rozkładem wielowymiarowym jest wielowymiarowy rozkład normalny .
Oprócz funkcji prawdopodobieństwa, funkcja skumulowanego rozkładu, funkcja masy prawdopodobieństwa i funkcja gęstości prawdopodobieństwa, funkcja generująca moment i funkcja charakterystyczna służą również do identyfikacji rozkładu prawdopodobieństwa, ponieważ jednoznacznie określają podstawową funkcję skumulowanego rozkładu.
Terminologia
Poniżej wymieniono kilka kluczowych pojęć i terminów, szeroko stosowanych w literaturze na temat rozkładów prawdopodobieństwa.
Funkcje dla zmiennych dyskretnych
- Funkcja prawdopodobieństwa : opisuje prawdopodobieństwo wystąpienia zdarzenia z przestrzeni próbki.
- Funkcja masy prawdopodobieństwa (pmf) : funkcja określająca prawdopodobieństwo, że dyskretna zmienna losowa jest równa pewnej wartości.
- Rozkład częstotliwości : tabela przedstawiająca częstotliwość różnych wyników w próbce .
- Względny rozkład częstości : rozkład częstości, w którym każda wartość została podzielona (znormalizowana) przez liczbę wyników w próbie (tj. wielkość próby).
- Dyskretna funkcja rozkładu prawdopodobieństwa : ogólny termin wskazujący sposób, w jaki całkowite prawdopodobieństwo 1 rozkłada się na wszystkie różne możliwe wyniki (tj. na całą populację) dla dyskretnej zmiennej losowej.
- Dystrybuanta : funkcja oceny prawdopodobieństwa , żebędzie przyjmować wartość mniejszą lub równądla dyskretnej zmiennej losowej.
- Rozkład jakościowy : dla dyskretnych zmiennych losowych o skończonym zbiorze wartości.
Funkcje dla zmiennych ciągłych
- Funkcja gęstości prawdopodobieństwa (pdf): funkcja, której wartość w dowolnej danej próbce (lub punkcie) w przestrzeni próbki (zbiór możliwych wartości przyjmowanych przez zmienną losową) może być interpretowana jako zapewniająca względne prawdopodobieństwo, że wartość zmiennej losowej będzie równa tej próbce.
- Ciągła funkcja rozkładu prawdopodobieństwa : najczęściej zarezerwowana dla ciągłych zmiennych losowych.
- Dystrybuanta : funkcja oceny prawdopodobieństwa , żebędzie przyjmować wartość mniejszą lub równądla zmiennych ciągłych.
- Funkcja kwantylowa : odwrotność funkcji rozkładu skumulowanego. Dajetakie, że z prawdopodobieństwem,nie przekroczy.
Podstawowe warunki
- Tryb : dla dyskretnej zmiennej losowej wartość o największym prawdopodobieństwie; dla ciągłej zmiennej losowej miejsce, w którym funkcja gęstości prawdopodobieństwa ma lokalny pik.
- Support : zbiór wartości, które można przyjąć z niezerowym prawdopodobieństwem przez zmienną losową. Dla zmiennej losowejjest czasami oznaczany jako.
- Tail : regiony w pobliżu granic zmiennej losowej, jeśli pmf lub pdf są w nich stosunkowo niskie. Zazwyczaj ma kształt , albo ich związku.
- Head : region, w którym pmf lub pdf jest stosunkowo wysoki. Zwykle ma formę .
- Oczekiwana wartość lub średnia : średnia ważona możliwych wartości, wykorzystująca ich prawdopodobieństwa jako wagi; lub jego ciągły analog.
- Mediana : wartość taka, że zbiór wartości mniejszych niż mediana i zbiór większych niż mediana mają prawdopodobieństwa nie większe niż połowa.
- Wariancja : drugi moment pmf lub pdf o średniej; ważna miara rozproszenia rozkładu.
- Odchylenie standardowe : pierwiastek kwadratowy z wariancji, a więc inna miara rozproszenia.
- Kwantyl : q-kwantyl to wartośćtaka, że.
- Symetria : właściwość niektórych rozkładów, w których część rozkładu po lewej stronie określonej wartości (zwykle mediana) jest lustrzanym odbiciem części po jej prawej stronie.
- Skośność : miara stopnia, w jakim pmf lub pdf „przechyla się” na jedną stronę swojej średniej. Trzeci standaryzowany moment dystrybucji.
- Kurtoza : miara "otłuszczenia" ogonów pmf lub pdf. Czwarty znormalizowany moment dystrybucji.
- Ciągłość: w matematyce ciągłość oznacza funkcję lub wartości, które nie ulegają nagłym zmianom.
Dyskretny rozkład prawdopodobieństwa
Dyskretny rozkład prawdopodobieństwa jest rozkład prawdopodobieństwa zmiennej losowej, która może przyjmować tylko liczby przeliczalne wartości. W przypadku, gdy zakres wartości jest przeliczalnie nieskończony, wartości te muszą spaść do zera wystarczająco szybko, aby prawdopodobieństwa sumowały się do 1. Na przykład, jeśli dla n = 1, 2, ..., suma prawdopodobieństw być 1/2 + 1/4 + 1/8 + ... = 1.
Znane dyskretne rozkłady prawdopodobieństwa stosowane w modelowaniu statystycznym obejmują rozkład Poissona , ten rozkład zero-jedynkowy , z rozkładu dwumianowego , z rozkładu geometrycznego , a Rozkład Pascala . Dodatkowo, dyskretny rozkład równomierny jest powszechnie używany w programach komputerowych, które dokonują losowych wyborów o równym prawdopodobieństwie spośród wielu wyborów.
Gdy próbka (zestaw obserwacji) jest pobierana z większej populacji, punkty próbkowania mają rozkład empiryczny, który jest dyskretny i dostarcza informacji o rozkładzie populacji.
Dystrybuanta
Równoważnie do powyższego, dyskretna zmienna losowa może być zdefiniowana jako zmienna losowa, której funkcja rozkładu skumulowanego (cdf) wzrasta tylko przez nieciągłości skoku — to znaczy, jej cdf wzrasta tylko wtedy, gdy „przeskakuje” do wyższej wartości i jest stała pomiędzy te skoki. Zauważ jednak, że punkty, w których przeskakuje cdf, mogą tworzyć gęsty zbiór liczb rzeczywistych. Punkty, w których występują skoki, są dokładnie tymi wartościami, jakie może przyjąć zmienna losowa.
Reprezentacja funkcji delta
W konsekwencji dyskretny rozkład prawdopodobieństwa jest często reprezentowany jako uogólniona funkcja gęstości prawdopodobieństwa obejmująca funkcje delta Diraca , co zasadniczo ujednolica traktowanie rozkładów ciągłych i dyskretnych. Jest to szczególnie przydatne w przypadku rozkładów prawdopodobieństwa obejmujących zarówno część ciągłą, jak i dyskretną.
Reprezentacja wskaźnikowo-funkcyjna
Dla dyskretnej zmiennej losowej X , niech u 0 , u 1 , ... będą wartościami, które może przyjąć z niezerowym prawdopodobieństwem. Oznaczać
Są to zbiory rozłączne , a dla takich zbiorów
Wynika z tego, że prawdopodobieństwo przyjęcia przez X dowolnej wartości poza u 0 , u 1 , ... wynosi zero, a zatem można zapisać X jako
z wyjątkiem zbioru prawdopodobieństwa zero, gdzie jest funkcją wskaźnika A . Może to służyć jako alternatywna definicja dyskretnych zmiennych losowych.
Rozkład jednopunktowy
Szczególnym przypadkiem jest dyskretny rozkład zmiennej losowej, która może przyjąć tylko jedną stałą wartość; innymi słowy, jest to rozkład deterministyczny . Formalnie wyrażona zmienna losowa ma rozkład jednopunktowy, jeśli ma możliwy wynik taki, że Wszystkie inne możliwe wyniki mają wtedy prawdopodobieństwo 0. Jej skumulowana funkcja rozkładu przeskakuje natychmiast z 0 do 1.
Ciągły rozkład prawdopodobieństwa
Ciągły rozkład prawdopodobieństwa jest rozkład prawdopodobieństwa, którego wsparcie jest niezliczona zestaw, taki jak w prawdziwym przedziale linii. Charakteryzują się one w unikalny sposób funkcją skumulowanego rozkładu, której można użyć do obliczenia prawdopodobieństwa dla każdego podzbioru wsparcia. Istnieje wiele przykładów ciągłych rozkładów prawdopodobieństwa: normalny , jednorodny , chi-kwadrat i inne .
Zmienna losowa ma ciągły rozkład prawdopodobieństwa, jeśli istnieje funkcja taka, że dla każdego przedziału prawdopodobieństwo przynależności jest podane przez całkę z over . Na przykład, jeśli , to mielibyśmy:
W szczególności prawdopodobieństwo przyjęcia dowolnej pojedynczej wartości (tj. ) wynosi zero, ponieważ całka pokrywająca się górną i dolną granicą jest zawsze równa zeru. Zmienna, która spełnia powyższe, nazywana jest ciągłą zmienną losową . Jego skumulowaną funkcję gęstości definiuje się jako
który zgodnie z tą definicją ma właściwości:
- nie maleje;
- ;
- i ;
- ; oraz
- jest ciągła ze względu na własności całkowe Riemanna .
Możliwe jest również myślenie w odwrotnym kierunku, co zapewnia większą elastyczność: jeśli jest funkcją, która spełnia wszystkie z wyjątkiem ostatniej z powyższych właściwości, to reprezentuje skumulowaną funkcję gęstości dla pewnej zmiennej losowej: dyskretna zmienna losowa if jest krokiem funkcji i ciągłej zmiennej losowej w przeciwnym razie. Pozwala to na ciągłe rozkłady, które mają skumulowaną funkcję gęstości, ale nie funkcję gęstości prawdopodobieństwa, taką jak rozkład Cantora .
Często konieczne jest uogólnienie powyższej definicji dla bardziej dowolnych podzbiorów linii rzeczywistej. W tych kontekstach ciągły rozkład prawdopodobieństwa definiuje się jako rozkład prawdopodobieństwa ze skumulowaną funkcją rozkładu, która jest absolutnie ciągła . Równoważnie jest to rozkład prawdopodobieństwa na liczbach rzeczywistych, który jest absolutnie ciągły względem miary Lebesgue'a . Takie rozkłady mogą być reprezentowane przez ich funkcje gęstości prawdopodobieństwa . Jeśli jest taką absolutnie ciągłą zmienną losową, to ma funkcję gęstości prawdopodobieństwa , a jej prawdopodobieństwo wpadnięcia do zbioru mierzalnego Lebesgue'a wynosi:
gdzie jest miara Lebesgue'a.
Uwaga dotycząca terminologii: niektórzy autorzy używają terminu „rozkład ciągły” na określenie rozkładów, których funkcje rozkładu skumulowanego są ciągłe , a nie absolutnie ciągłe . Te dystrybucje są takie, że dla wszystkich . Definicja ta obejmuje (bezwzględnie) ciągłe rozkłady zdefiniowane powyżej, ale obejmuje również rozkłady osobliwe , które nie są ani absolutnie ciągłe, ani dyskretne, ani ich mieszaniną i nie mają gęstości. Przykład podaje rozkład Cantora .
Definicja Kołmogorowa
W miar-theoretic formalizacji teorii prawdopodobieństwa , A Zmienna losowa jest zdefiniowany jako funkcji mierzalnej ze przestrzeni prawdopodobieństwa do mierzalnego przestrzeni . Biorąc pod uwagę, że prawdopodobieństwo zdarzeń formularza zaspokoić aksjomaty prawdopodobieństwa Kołmogorowa w The rozkład prawdopodobieństwa X jest miarą odwzorowanie styczne z , która jest miarą probabilistyczną na zaspokojenie .
Inne rodzaje dystrybucji
Rozkłady ciągłe i dyskretne z obsługą lub są niezwykle przydatne do modelowania niezliczonych zjawisk, ponieważ większość praktycznych rozkładów jest obsługiwana na stosunkowo prostych podzbiorach, takich jak hipersześciany lub kule . Jednak nie zawsze tak jest i istnieją zjawiska z podporami, które są w rzeczywistości skomplikowanymi krzywymi w jakiejś przestrzeni lub podobnym. W takich przypadkach rozkład prawdopodobieństwa opiera się na obrazie takiej krzywej i prawdopodobnie zostanie określony empirycznie, a nie zamknięty dla niego wzór.
Jeden przykład pokazano na rysunku po prawej stronie, który pokazuje ewolucję układu równań różniczkowych (powszechnie znanych jako równania Rabinovicha-Fabrikanta ), które można wykorzystać do modelowania zachowania fal Langmuira w plazmie . Kiedy badamy to zjawisko, obserwowane stany z podzbioru są zaznaczone na czerwono. Można więc zapytać, jakie jest prawdopodobieństwo zaobserwowania stanu w określonej pozycji podzbioru czerwonego; jeśli takie prawdopodobieństwo istnieje, nazywa się je miarą prawdopodobieństwa systemu.
Ten rodzaj skomplikowanej obsługi pojawia się dość często w układach dynamicznych . Nie jest łatwo ustalić, czy system ma miarę prawdopodobieństwa, a główny problem jest następujący. Niech będą chwilami w czasie i podzbiorem wsparcia; gdyby dla systemu istniała miara prawdopodobieństwa, należałoby oczekiwać, że częstość obserwowanych stanów w zbiorze będzie równa w przedziale i , co może się nie zdarzyć; na przykład może oscylować podobnie do sinusa, , którego granica nie jest zbieżna. Formalnie miara istnieje tylko wtedy, gdy granica względnej częstotliwości zbiega się, gdy system jest obserwowany w nieskończonej przyszłości. Gałąź układów dynamicznych badająca istnienie miary prawdopodobieństwa to teoria ergodyczna .
Należy zauważyć, że nawet w tych przypadkach rozkład prawdopodobieństwa, jeśli istnieje, może nadal być określany jako „ciągły” lub „dyskretny” w zależności od tego, czy wsparcie jest odpowiednio niepoliczalne czy policzalne.
Generowanie liczb losowych
Większość algorytmów opiera się na generatorze liczb pseudolosowych, który generuje liczby X, które są równomiernie rozłożone w przedziale półotwartym [0,1). Te zmienne losowe X są następnie przekształcane za pomocą pewnego algorytmu, aby utworzyć nową zmienną losową o wymaganym rozkładzie prawdopodobieństwa. Dzięki temu źródłu jednolitej pseudolosowości można generować realizacje dowolnej zmiennej losowej.
Załóżmy na przykład, że ma rozkład jednostajny między 0 a 1. Aby skonstruować losową zmienną Bernoulliego dla niektórych , definiujemy
aby
Ta zmienna losowa X ma rozkład Bernoulliego z parametrem . Zauważ, że jest to transformacja dyskretnej zmiennej losowej.
W przypadku funkcji rozkładu ciągłej zmiennej losowej należy skonstruować ciągłą zmienną losową. , funkcja odwrotna , odnosi się do zmiennej jednorodnej :
Załóżmy na przykład, że musi zostać skonstruowana zmienna losowa, która ma rozkład wykładniczy .
więc i jeśli ma rozkład, to zmienna losowa jest zdefiniowana przez . Ma to rozkład wykładniczy .
Częstym problemem w symulacjach statystycznych ( metoda Monte Carlo ) jest generowanie liczb pseudolosowych o określonym rozkładzie.
Powszechne rozkłady prawdopodobieństwa i ich zastosowania
Pojęcie rozkładu prawdopodobieństwa i zmiennych losowych, które one opisują, leży u podstaw matematycznej dyscypliny teorii prawdopodobieństwa i nauki o statystyce. Istnieje rozpiętość lub zmienność prawie każdej wartości, którą można zmierzyć w populacji (np. wzrost ludzi, trwałość metalu, wzrost sprzedaży, natężenie ruchu itp.); prawie wszystkie pomiary są dokonywane z pewnym błędem wewnętrznym; w fizyce wiele procesów jest opisanych probabilistycznie, od właściwości kinetycznych gazów po kwantowo-mechaniczny opis cząstek elementarnych . Z tych i wielu innych powodów proste liczby są często niewystarczające do opisania wielkości, podczas gdy rozkłady prawdopodobieństwa są często bardziej odpowiednie.
Poniżej znajduje się lista niektórych z najczęstszych rozkładów prawdopodobieństwa, pogrupowanych według typu procesu, z którym są powiązane. Aby uzyskać pełniejszą listę, zobacz listę rozkładów prawdopodobieństwa , które grupują według charakteru rozważanego wyniku (dyskretny, ciągły, wielowymiarowy itp.)
Wszystkie poniższe rozkłady jednowymiarowe mają pojedynczą wartość szczytową; to znaczy zakłada się, że wartości skupiają się wokół jednego punktu. W praktyce faktycznie obserwowane wielkości mogą skupiać się wokół wielu wartości. Takie wielkości można modelować za pomocą rozkładu mieszaniny .
Wzrost liniowy (np. błędy, przesunięcia)
- Rozkład normalny ( rozkład Gaussa), dla jednej takiej wielkości; najczęściej stosowany rozkład ciągły
Wzrost wykładniczy (np. ceny, dochody, populacje)
- Rozkład logarytmiczno-normalny dla pojedynczej takiej wielkości, której logarytm ma rozkład normalny
- Rozkład Pareto , dla pojedynczej takiej wielkości, której log jest rozłożony wykładniczo ; prototypowa dystrybucja prawa energetycznego
Ilości równomiernie rozłożone
- Dyskretny rozkład równomierny , dla skończonego zbioru wartości (np. wynik sprawiedliwej kości)
- Rozkład jednostajny ciągły , dla wartości o rozkładzie ciągłym
Próby Bernoulliego (tak/nie zdarzenia, z określonym prawdopodobieństwem)
- Podstawowe dystrybucje:
- Rozkład Bernoulliego dla wyniku pojedynczej próby Bernoulliego (np. sukces/porażka, tak/nie)
- Rozkład dwumianowy dla liczby „pozytywnych wystąpień” (np. sukcesów, głosów „tak” itp.) przy ustalonej łącznej liczbie niezależnych wystąpień
- Ujemny rozkład dwumianowy , dla obserwacji typu dwumianowego, ale gdzie interesującą wielkością jest liczba niepowodzeń przed wystąpieniem określonej liczby sukcesów
- Dystrybucja geometryczna , dla obserwacji typu dwumianowego, ale gdzie interesującą wielkością jest liczba niepowodzeń przed pierwszym sukcesem; szczególny przypadek ujemnego rozkładu dwumianowego
- Związane z schematami pobierania próbek w skończonej populacji:
- Rozkład hipergeometryczny , dla liczby „pozytywnych wystąpień” (np. sukcesów, głosów „tak” itp.) przy ustalonej liczbie wszystkich wystąpień, przy użyciu próbkowania bez zastępowania
- Rozkład beta-dwumianowy dla liczby „pozytywnych zdarzeń” (np. sukcesów, głosów „tak” itp.) przy ustalonej liczbie wszystkich zdarzeń, pobieranie próbek za pomocą modelu urny Pólya (w pewnym sensie „przeciwieństwo” pobierania próbek bez zastępowania )
Wyniki kategoryczne (zdarzenia z K możliwych wyników)
- Rozkład kategoryczny , dla pojedynczego wyniku kategorycznego (np. tak/nie/być może w ankiecie); uogólnienie rozkładu Bernoulliego
- Rozkład wielomianowy , dla liczby każdego typu wyniku kategorycznego, przy ustalonej liczbie wyników całkowitych; uogólnienie rozkładu dwumianowego
- Wielowymiarowy rozkład hipergeometryczny , podobny do rozkładu wielomianowego , ale z próbkowaniem bez zastępowania ; uogólnienie rozkładu hipergeometrycznego
Proces Poissona (zdarzenia, które występują niezależnie z zadaną szybkością)
- Rozkład Poissona , dla liczby wystąpień zdarzenia typu Poissona w danym okresie czasu
- Rozkład wykładniczy , dla czasu przed wystąpieniem następnego zdarzenia typu Poissona
- Rozkład gamma , dla czasu przed wystąpieniem kolejnych k zdarzeń typu Poissona
Wartości bezwzględne wektorów o składowych o rozkładzie normalnym
- Rozkład Rayleigha , dla rozkładu wielkości wektorowych z komponentami ortogonalnymi o rozkładzie Gaussa. Rozkłady Rayleigha znajdują się w sygnałach RF ze składowymi rzeczywistymi i urojonymi Gaussa.
- Dystrybucja ryżu , uogólnienie rozkładów Rayleigha dla miejsc, w których występuje nieruchomy składnik sygnału tła. Znaleziony w Rician zanikanie sygnałów radiowych z powodu propagacji wielościeżkowej oraz w obrazach MR z zniekształceniem szumu na niezerowych sygnałach NMR.
Wielkości o normalnym rozkładzie operowane sumą kwadratów
- Rozkład chi-kwadrat , rozkład sumy kwadratów standardowych zmiennych normalnych ; przydatne np. do wnioskowania o wariancji próby próbek o rozkładzie normalnym (patrz test chi-kwadrat )
- Rozkład t-Studenta , rozkład ilorazu standardowej zmiennej normalnej i pierwiastka kwadratowego przeskalowanej zmiennej chi-kwadrat ; przydatne do wnioskowania o średniej z próbek o rozkładzie normalnym o nieznanej wariancji (patrz test t-Studenta )
- F-dystrybucja , rozkład stosunku dwóch skalowanych zmiennych chi-kwadrat ; przydatne np. do wnioskowania, które obejmuje porównywanie wariancji lub R-kwadrat ( współczynnik korelacji kwadratów )
Jako sprzężone rozkłady a priori we wnioskowaniu bayesowskim
- Rozkład beta , dla pojedynczego prawdopodobieństwa (liczba rzeczywista od 0 do 1); sprzężony z rozkładem Bernoulliego i rozkładem dwumianowym
- Rozkład gamma , dla nieujemnego parametru skalowania; sprzężona z parametrem szybkości rozkładu Poissona lub rozkładu wykładniczego , precyzją (odwrotną wariancją ) rozkładu normalnego itp.
- Rozkład Dirichleta dla wektora prawdopodobieństw, które muszą się sumować do 1; sprzężony z rozkładem kategorycznym i rozkładem wielomianowym ; uogólnienie dystrybucji beta
- Rozkład Wisharta dla symetrycznej nieujemnej macierzy określonej ; koniugat odwrotności macierzy kowariancji z wielowymiarowej rozkładu normalnego ; uogólnienie rozkładu gamma
Niektóre specjalistyczne zastosowania rozkładów prawdopodobieństwa
- Te modele językowe cache i inne modele językowe statystyczne wykorzystywane w przetwarzaniu języka naturalnego , aby przypisać do prawdopodobieństwa wystąpienia poszczególnych słów i sekwencji słownych zrobić za pomocą rozkładów prawdopodobieństwa.
- W mechanice kwantowej gęstość prawdopodobieństwa znalezienia cząstki w danym punkcie jest proporcjonalna do kwadratu wielkości funkcji falowej cząstki w tym punkcie (patrz reguła Borna ). W związku z tym funkcja rozkładu prawdopodobieństwa pozycji cząstki jest opisana przez , prawdopodobieństwo, że pozycja cząstki x będzie w przedziale a ≤ x ≤ bw wymiarze pierwszym, oraz podobna całka potrójna w wymiarze trzecim. To kluczowa zasada mechaniki kwantowej.
- Probabilistyczny przepływ obciążenia w badaniu rozpływu mocy wyjaśnia niepewności zmiennych wejściowych jako rozkład prawdopodobieństwa i zapewnia obliczenie rozpływu mocy również pod względem rozkładu prawdopodobieństwa.
- Przewidywanie występowania zjawisk naturalnych na podstawie wcześniejszych rozkładów częstotliwości, takich jak cyklony tropikalne , grad, czas pomiędzy zdarzeniami itp.
Zobacz też
- Rozkład prawdopodobieństwa warunkowego
- Wspólny rozkład prawdopodobieństwa
- Rozkład quasi-prawdopodobieństwa
- Empiryczny rozkład prawdopodobieństwa
- Histogram
- Całe zastosowanie Riemanna-Stieltjesa do teorii prawdopodobieństwa
Listy
Bibliografia
Cytaty
Źródła
- Den Dekker, AJ; Sijbers, J. (2014). „Rozkłady danych w obrazach rezonansu magnetycznego: przegląd”. Physica Medica . 30 (7): 725–741. doi : 10.1016/j.ejmp.2014.05.002 . PMID 25059432 .
- Vapnik, Władimir Naumowicz (1998). Statystyczna teoria uczenia się . John Wiley i Synowie.
Zewnętrzne linki
- „Rozkład prawdopodobieństwa” , Encyklopedia Matematyki , EMS Press , 2001 [1994]
- Przewodnik terenowy po ciągłych rozkładach prawdopodobieństwa , Gavin E. Crooks.