Rozkład prawdopodobieństwa - Probability distribution

W teorii prawdopodobieństwa i statystyki , o rozkład prawdopodobieństwa jest matematyczną funkcją , która daje prawdopodobieństwa wystąpienia różnych możliwych wyników dla eksperymentu . Jest to matematyczny opis przypadkowej zjawiska pod względem jej powierzchni próbki oraz prawdopodobieństw o wydarzeniach (podzbiorów przestrzeni próby).

Na przykład, jeśli X jest używane do oznaczenia wyniku rzutu monetą („eksperyment”), wówczas rozkład prawdopodobieństwa X przyjmie wartość 0,5 (1 na 2 lub 1/2) dla X  = orły i 0,5 dla X  = reszki (przy założeniu, że moneta jest fair ). Przykładami zjawisk losowych są warunki pogodowe w przyszłości, wzrost losowo wybranej osoby, odsetek uczniów płci męskiej w szkole, wyniki ankiety do przeprowadzenia itp.

Wstęp

Funkcja masy prawdopodobieństwa (pmf) p ( S ) określa rozkład prawdopodobieństwa dla sumy S zliczeń z dwóch kostek . Na przykład rysunek pokazuje, że p (11) = 2/36 = 1/18. pmf pozwala na obliczenie prawdopodobieństw zdarzeń takich jak P ( S > 9) = 1/12 + 1/18 + 1/36 = 1/6 i wszystkich innych prawdopodobieństw w rozkładzie.

Rozkład prawdopodobieństwa to matematyczny opis prawdopodobieństw zdarzeń, podzbiorów przestrzeni próbek . Przestrzeń prób, często oznaczana przez , jest zbiorem wszystkich możliwych skutków obserwowanego zjawiska losowego; może to być dowolny zbiór: zbiór liczb rzeczywistych , zbiór wektorów , zbiór dowolnych wartości nieliczbowych itp. Na przykład przestrzeń próbna rzutu monetą to Ω = {orzechy, reszki} .

Aby zdefiniować rozkłady prawdopodobieństwa dla konkretnego przypadku zmiennych losowych (tak, aby przestrzeń próbki była postrzegana jako zbiór liczbowy), często rozróżnia się dyskretne i ciągłe zmienne losowe . W przypadku dyskretnym wystarczy określić funkcję masy prawdopodobieństwa przypisującą prawdopodobieństwo każdemu możliwemu wynikowi: na przykład przy rzucaniu sprawiedliwą kostką każda z sześciu wartości od 1 do 6 ma prawdopodobieństwo 1/6. Prawdopodobieństwo zdarzenia jest następnie definiowane jako suma prawdopodobieństw wyników, które spełniają zdarzenie; na przykład prawdopodobieństwo zdarzenia „na kostce wyrzuci parzystą wartość” wynosi

W przeciwieństwie do tego, gdy zmienna losowa przyjmuje wartości z kontinuum, zazwyczaj każdy pojedynczy wynik ma prawdopodobieństwo zerowe i tylko zdarzenia, które zawierają nieskończenie wiele wyników, takie jak przedziały, mogą mieć prawdopodobieństwo dodatnie. Rozważmy na przykład zmierzenie wagi kawałka szynki w supermarkecie i załóżmy, że waga ma precyzję wielu cyfr. Prawdopodobieństwo, że waży dokładnie 500 g, wynosi zero, ponieważ najprawdopodobniej będzie miał kilka niezerowych cyfr dziesiętnych. Niemniej jednak można by wymagać w kontroli jakości, aby opakowanie szynki „500 g” ważyć od 490 g do 510 g z co najmniej 98% prawdopodobieństwem, a żądanie to jest mniej wrażliwe na dokładność przyrządów pomiarowych.

Po lewej stronie znajduje się funkcja gęstości prawdopodobieństwa. Po prawej stronie znajduje się funkcja rozkładu skumulowanego, czyli pole pod krzywą gęstości prawdopodobieństwa.

Ciągłe rozkłady prawdopodobieństwa można opisać na kilka sposobów. Funkcja gęstości prawdopodobieństwa opisuje nieskończenie małe prawdopodobieństwo dowolnej danej wartości, a prawdopodobieństwo, że wynik leży w danym przedziale, można obliczyć, całkując funkcję gęstości prawdopodobieństwa w tym przedziale. Alternatywnym opisem rozkładu jest funkcja skumulowanego rozkładu , która opisuje prawdopodobieństwo, że zmienna losowa nie jest większa niż dana wartość (tj. P ( X < x ) dla niektórych x ). Funkcja rozkładu skumulowanego to obszar pod funkcją gęstości prawdopodobieństwa od do x , jak opisano na rysunku po prawej stronie.

Ogólna definicja

Rozkład prawdopodobieństwa można opisać w różnych postaciach, na przykład za pomocą funkcji masy prawdopodobieństwa lub funkcji rozkładu skumulowanego. Jednym z najbardziej ogólnych opisów, który dotyczy zmiennych ciągłych i dyskretnych, jest użycie funkcji prawdopodobieństwa, której przestrzeń wejściowa jest powiązana z przestrzenią próbki i daje jako wyjście prawdopodobieństwo liczby rzeczywistej .

Funkcja prawdopodobieństwa P może przyjąć jako podzbiory argumentów samej przestrzeni próbek, jak w przykładzie rzutu monetą, gdzie funkcja P została zdefiniowana tak, że P (orzeł) = 0.5 i P (regon) = 0.5 . Jednak ze względu na powszechne stosowanie zmiennych losowych , które przekształcają przestrzeń próby w zbiór liczb (np. , ), częściej bada się rozkłady prawdopodobieństwa, których argumentem są podzbiory tych konkretnych rodzajów zbiorów (zbiorów liczb), i wszystkie rozkłady prawdopodobieństwa omówione w tym artykule są tego typu. Oczywiste jest, w celu określenia, jak P ( X e ), prawdopodobieństwo tego, że pewna zmienna X należy do pewnego zdarzenia E .

Powyższa funkcja prawdopodobieństwa charakteryzuje rozkład prawdopodobieństwa tylko wtedy, gdy spełnia wszystkie aksjomaty Kołmogorowa , czyli:

  1. , więc prawdopodobieństwo jest nieujemne
  2. , więc prawdopodobieństwo nie przekracza
  3. dla każdej rozłącznej rodziny zbiorów

Pojęcie funkcji prawdopodobieństwa jest bardziej rygorystyczne poprzez zdefiniowanie jej jako elementu przestrzeni prawdopodobieństwa , gdzie jest zbiorem możliwych wyników, jest zbiorem wszystkich podzbiorów, których prawdopodobieństwo można zmierzyć i jest funkcją prawdopodobieństwa lub miarą prawdopodobieństwa , który przypisuje prawdopodobieństwo każdemu z tych mierzalnych podzbiorów .

Rozkłady prawdopodobieństwa dzieli się na ogół na dwie klasy. Dyskretny rozkład prawdopodobieństwa jest zastosowanie w sytuacjach, gdy zestaw możliwych realizacji dyskretnych (np monetą, rolkę matrycy) i prawdopodobieństwa są kodowane przez dyskretną liście prawdopodobieństw wyników; w tym przypadku dyskretny rozkład prawdopodobieństwa jest znany jako funkcja masy prawdopodobieństwa . Z drugiej strony, ciągłe rozkłady prawdopodobieństwa mają zastosowanie do scenariuszy, w których zbiór możliwych wyników może przyjmować wartości z zakresu ciągłego (np. liczby rzeczywiste), takie jak temperatura w danym dniu. W przypadku liczb rzeczywistych ciągły rozkład prawdopodobieństwa jest funkcją rozkładu skumulowanego . Ogólnie rzecz biorąc, w przypadku ciągłym, prawdopodobieństwa opisuje funkcja gęstości prawdopodobieństwa , a rozkład prawdopodobieństwa jest z definicji całką funkcji gęstości prawdopodobieństwa. Rozkład normalny to powszechnie spotykany ciągły rozkład prawdopodobieństwa. Bardziej złożone eksperymenty, takie jak te dotyczące procesów stochastycznych definiowanych w czasie ciągłym , mogą wymagać zastosowania bardziej ogólnych miar prawdopodobieństwa .

Rozkład prawdopodobieństwa, którego przestrzeń prób jest jednowymiarowa (na przykład liczby rzeczywiste, lista etykiet, etykiety uporządkowane lub binarny) jest nazywany jednowymiarowym , natomiast rozkład, którego przestrzeń prób jest przestrzenią wektorową o wymiarze 2 lub większym, jest nazywany wielowymiarowym . Rozkład jednowymiarowy podaje prawdopodobieństwa przyjęcia przez pojedynczą zmienną losową różnych wartości; rozkład wielowymiarowy ( łączny rozkład prawdopodobieństwa ) podaje prawdopodobieństwa losowego wektora – listy dwóch lub więcej zmiennych losowych – przyjmujących różne kombinacje wartości. Ważne i powszechnie spotykane rozkłady prawdopodobieństwa jednowymiarowej obejmują rozkład dwumianowy , o dystrybucję hipergeometryczny , a rozkład normalny . Powszechnie spotykanym rozkładem wielowymiarowym jest wielowymiarowy rozkład normalny .

Oprócz funkcji prawdopodobieństwa, funkcja skumulowanego rozkładu, funkcja masy prawdopodobieństwa i funkcja gęstości prawdopodobieństwa, funkcja generująca moment i funkcja charakterystyczna służą również do identyfikacji rozkładu prawdopodobieństwa, ponieważ jednoznacznie określają podstawową funkcję skumulowanego rozkładu.

Funkcja gęstości prawdopodobieństwa (pdf) rozkładu normalnego , zwana również krzywą Gaussa lub „krzywą dzwonową”, najważniejszy ciągły rozkład losowy. Jak zaznaczono na rysunku, prawdopodobieństwa przedziałów wartości odpowiadają polu pod krzywą.

Terminologia

Poniżej wymieniono kilka kluczowych pojęć i terminów, szeroko stosowanych w literaturze na temat rozkładów prawdopodobieństwa.

Funkcje dla zmiennych dyskretnych

  • Funkcja prawdopodobieństwa : opisuje prawdopodobieństwo wystąpienia zdarzenia z przestrzeni próbki.
  • Funkcja masy prawdopodobieństwa (pmf) : funkcja określająca prawdopodobieństwo, że dyskretna zmienna losowa jest równa pewnej wartości.
  • Rozkład częstotliwości : tabela przedstawiająca częstotliwość różnych wyników w próbce .
  • Względny rozkład częstości : rozkład częstości, w którym każda wartość została podzielona (znormalizowana) przez liczbę wyników w próbie (tj. wielkość próby).
  • Dyskretna funkcja rozkładu prawdopodobieństwa : ogólny termin wskazujący sposób, w jaki całkowite prawdopodobieństwo 1 rozkłada się na wszystkie różne możliwe wyniki (tj. na całą populację) dla dyskretnej zmiennej losowej.
  • Dystrybuanta : funkcja oceny prawdopodobieństwa , żebędzie przyjmować wartość mniejszą lub równądla dyskretnej zmiennej losowej.
  • Rozkład jakościowy : dla dyskretnych zmiennych losowych o skończonym zbiorze wartości.

Funkcje dla zmiennych ciągłych

  • Funkcja gęstości prawdopodobieństwa (pdf): funkcja, której wartość w dowolnej danej próbce (lub punkcie) w przestrzeni próbki (zbiór możliwych wartości przyjmowanych przez zmienną losową) może być interpretowana jako zapewniająca względne prawdopodobieństwo, że wartość zmiennej losowej będzie równa tej próbce.
  • Ciągła funkcja rozkładu prawdopodobieństwa : najczęściej zarezerwowana dla ciągłych zmiennych losowych.
  • Dystrybuanta : funkcja oceny prawdopodobieństwa , żebędzie przyjmować wartość mniejszą lub równądla zmiennych ciągłych.
  • Funkcja kwantylowa : odwrotność funkcji rozkładu skumulowanego. Dajetakie, że z prawdopodobieństwem,nie przekroczy.

Podstawowe warunki

  • Tryb : dla dyskretnej zmiennej losowej wartość o największym prawdopodobieństwie; dla ciągłej zmiennej losowej miejsce, w którym funkcja gęstości prawdopodobieństwa ma lokalny pik.
  • Support : zbiór wartości, które można przyjąć z niezerowym prawdopodobieństwem przez zmienną losową. Dla zmiennej losowejjest czasami oznaczany jako.
  • Tail : regiony w pobliżu granic zmiennej losowej, jeśli pmf lub pdf są w nich stosunkowo niskie. Zazwyczaj ma kształt , albo ich związku.
  • Head : region, w którym pmf lub pdf jest stosunkowo wysoki. Zwykle ma formę .
  • Oczekiwana wartość lub średnia : średnia ważona możliwych wartości, wykorzystująca ich prawdopodobieństwa jako wagi; lub jego ciągły analog.
  • Mediana : wartość taka, że ​​zbiór wartości mniejszych niż mediana i zbiór większych niż mediana mają prawdopodobieństwa nie większe niż połowa.
  • Wariancja : drugi moment pmf lub pdf o średniej; ważna miara rozproszenia rozkładu.
  • Odchylenie standardowe : pierwiastek kwadratowy z wariancji, a więc inna miara rozproszenia.
  • Kwantyl : q-kwantyl to wartośćtaka, że.
  • Symetria : właściwość niektórych rozkładów, w których część rozkładu po lewej stronie określonej wartości (zwykle mediana) jest lustrzanym odbiciem części po jej prawej stronie.
  • Skośność : miara stopnia, w jakim pmf lub pdf „przechyla się” na jedną stronę swojej średniej. Trzeci standaryzowany moment dystrybucji.
  • Kurtoza : miara "otłuszczenia" ogonów pmf lub pdf. Czwarty znormalizowany moment dystrybucji.
  • Ciągłość: w matematyce ciągłość oznacza funkcję lub wartości, które nie ulegają nagłym zmianom.

Dyskretny rozkład prawdopodobieństwa

Masowa funkcja prawdopodobieństwa dyskretnego rozkładu prawdopodobieństwa. Prawdopodobieństwa singletonów {1}, {3} i {7} wynoszą odpowiednio 0,2, 0,5, 0,3. Zbiór niezawierający żadnego z tych punktów ma prawdopodobieństwo zerowe.
CDF z dyskretnym rozkładem prawdopodobieństwa, ...
... o ciągłym rozkładzie prawdopodobieństwa, ...
... dystrybucji, która ma zarówno część ciągłą, jak i część dyskretną.

Dyskretny rozkład prawdopodobieństwa jest rozkład prawdopodobieństwa zmiennej losowej, która może przyjmować tylko liczby przeliczalne wartości. W przypadku, gdy zakres wartości jest przeliczalnie nieskończony, wartości te muszą spaść do zera wystarczająco szybko, aby prawdopodobieństwa sumowały się do 1. Na przykład, jeśli dla n = 1, 2, ..., suma prawdopodobieństw być 1/2 + 1/4 + 1/8 + ... = 1.

Znane dyskretne rozkłady prawdopodobieństwa stosowane w modelowaniu statystycznym obejmują rozkład Poissona , ten rozkład zero-jedynkowy , z rozkładu dwumianowego , z rozkładu geometrycznego , a Rozkład Pascala . Dodatkowo, dyskretny rozkład równomierny jest powszechnie używany w programach komputerowych, które dokonują losowych wyborów o równym prawdopodobieństwie spośród wielu wyborów.

Gdy próbka (zestaw obserwacji) jest pobierana z większej populacji, punkty próbkowania mają rozkład empiryczny, który jest dyskretny i dostarcza informacji o rozkładzie populacji.

Dystrybuanta

Równoważnie do powyższego, dyskretna zmienna losowa może być zdefiniowana jako zmienna losowa, której funkcja rozkładu skumulowanego (cdf) wzrasta tylko przez nieciągłości skoku — to znaczy, jej cdf wzrasta tylko wtedy, gdy „przeskakuje” do wyższej wartości i jest stała pomiędzy te skoki. Zauważ jednak, że punkty, w których przeskakuje cdf, mogą tworzyć gęsty zbiór liczb rzeczywistych. Punkty, w których występują skoki, są dokładnie tymi wartościami, jakie może przyjąć zmienna losowa.

Reprezentacja funkcji delta

W konsekwencji dyskretny rozkład prawdopodobieństwa jest często reprezentowany jako uogólniona funkcja gęstości prawdopodobieństwa obejmująca funkcje delta Diraca , co zasadniczo ujednolica traktowanie rozkładów ciągłych i dyskretnych. Jest to szczególnie przydatne w przypadku rozkładów prawdopodobieństwa obejmujących zarówno część ciągłą, jak i dyskretną.

Reprezentacja wskaźnikowo-funkcyjna

Dla dyskretnej zmiennej losowej X , niech u 0 , u 1 , ... będą wartościami, które może przyjąć z niezerowym prawdopodobieństwem. Oznaczać

Są to zbiory rozłączne , a dla takich zbiorów

Wynika z tego, że prawdopodobieństwo przyjęcia przez X dowolnej wartości poza u 0 , u 1 , ... wynosi zero, a zatem można zapisać X jako

z wyjątkiem zbioru prawdopodobieństwa zero, gdzie jest funkcją wskaźnika A . Może to służyć jako alternatywna definicja dyskretnych zmiennych losowych.

Rozkład jednopunktowy

Szczególnym przypadkiem jest dyskretny rozkład zmiennej losowej, która może przyjąć tylko jedną stałą wartość; innymi słowy, jest to rozkład deterministyczny . Formalnie wyrażona zmienna losowa ma rozkład jednopunktowy, jeśli ma możliwy wynik taki, że Wszystkie inne możliwe wyniki mają wtedy prawdopodobieństwo 0. Jej skumulowana funkcja rozkładu przeskakuje natychmiast z 0 do 1.

Ciągły rozkład prawdopodobieństwa

Ciągły rozkład prawdopodobieństwa jest rozkład prawdopodobieństwa, którego wsparcie jest niezliczona zestaw, taki jak w prawdziwym przedziale linii. Charakteryzują się one w unikalny sposób funkcją skumulowanego rozkładu, której można użyć do obliczenia prawdopodobieństwa dla każdego podzbioru wsparcia. Istnieje wiele przykładów ciągłych rozkładów prawdopodobieństwa: normalny , jednorodny , chi-kwadrat i inne .

Zmienna losowa ma ciągły rozkład prawdopodobieństwa, jeśli istnieje funkcja taka, że ​​dla każdego przedziału prawdopodobieństwo przynależności jest podane przez całkę z over . Na przykład, jeśli , to mielibyśmy:

W szczególności prawdopodobieństwo przyjęcia dowolnej pojedynczej wartości (tj. ) wynosi zero, ponieważ całka pokrywająca się górną i dolną granicą jest zawsze równa zeru. Zmienna, która spełnia powyższe, nazywana jest ciągłą zmienną losową . Jego skumulowaną funkcję gęstości definiuje się jako

który zgodnie z tą definicją ma właściwości:

  • nie maleje;
  • ;
  • i ;
  • ; oraz
  • jest ciągła ze względu na własności całkowe Riemanna .

Możliwe jest również myślenie w odwrotnym kierunku, co zapewnia większą elastyczność: jeśli jest funkcją, która spełnia wszystkie z wyjątkiem ostatniej z powyższych właściwości, to reprezentuje skumulowaną funkcję gęstości dla pewnej zmiennej losowej: dyskretna zmienna losowa if jest krokiem funkcji i ciągłej zmiennej losowej w przeciwnym razie. Pozwala to na ciągłe rozkłady, które mają skumulowaną funkcję gęstości, ale nie funkcję gęstości prawdopodobieństwa, taką jak rozkład Cantora .

Często konieczne jest uogólnienie powyższej definicji dla bardziej dowolnych podzbiorów linii rzeczywistej. W tych kontekstach ciągły rozkład prawdopodobieństwa definiuje się jako rozkład prawdopodobieństwa ze skumulowaną funkcją rozkładu, która jest absolutnie ciągła . Równoważnie jest to rozkład prawdopodobieństwa na liczbach rzeczywistych, który jest absolutnie ciągły względem miary Lebesgue'a . Takie rozkłady mogą być reprezentowane przez ich funkcje gęstości prawdopodobieństwa . Jeśli jest taką absolutnie ciągłą zmienną losową, to ma funkcję gęstości prawdopodobieństwa , a jej prawdopodobieństwo wpadnięcia do zbioru mierzalnego Lebesgue'a wynosi:

gdzie jest miara Lebesgue'a.

Uwaga dotycząca terminologii: niektórzy autorzy używają terminu „rozkład ciągły” na określenie rozkładów, których funkcje rozkładu skumulowanego są ciągłe , a nie absolutnie ciągłe . Te dystrybucje są takie, że dla wszystkich . Definicja ta obejmuje (bezwzględnie) ciągłe rozkłady zdefiniowane powyżej, ale obejmuje również rozkłady osobliwe , które nie są ani absolutnie ciągłe, ani dyskretne, ani ich mieszaniną i nie mają gęstości. Przykład podaje rozkład Cantora .

Definicja Kołmogorowa

W miar-theoretic formalizacji teorii prawdopodobieństwa , A Zmienna losowa jest zdefiniowany jako funkcji mierzalnej ze przestrzeni prawdopodobieństwa do mierzalnego przestrzeni . Biorąc pod uwagę, że prawdopodobieństwo zdarzeń formularza zaspokoić aksjomaty prawdopodobieństwa Kołmogorowa w The rozkład prawdopodobieństwa X jest miarą odwzorowanie styczne z , która jest miarą probabilistyczną na zaspokojenie .

Inne rodzaje dystrybucji

Jedno rozwiązanie dla równań Rabinovicha-Fabrikanta . Jakie jest prawdopodobieństwo zaobserwowania stanu w określonym miejscu podpory (tj. podzbiór czerwony)?

Rozkłady ciągłe i dyskretne z obsługą lub są niezwykle przydatne do modelowania niezliczonych zjawisk, ponieważ większość praktycznych rozkładów jest obsługiwana na stosunkowo prostych podzbiorach, takich jak hipersześciany lub kule . Jednak nie zawsze tak jest i istnieją zjawiska z podporami, które są w rzeczywistości skomplikowanymi krzywymi w jakiejś przestrzeni lub podobnym. W takich przypadkach rozkład prawdopodobieństwa opiera się na obrazie takiej krzywej i prawdopodobnie zostanie określony empirycznie, a nie zamknięty dla niego wzór.

Jeden przykład pokazano na rysunku po prawej stronie, który pokazuje ewolucję układu równań różniczkowych (powszechnie znanych jako równania Rabinovicha-Fabrikanta ), które można wykorzystać do modelowania zachowania fal Langmuira w plazmie . Kiedy badamy to zjawisko, obserwowane stany z podzbioru są zaznaczone na czerwono. Można więc zapytać, jakie jest prawdopodobieństwo zaobserwowania stanu w określonej pozycji podzbioru czerwonego; jeśli takie prawdopodobieństwo istnieje, nazywa się je miarą prawdopodobieństwa systemu.

Ten rodzaj skomplikowanej obsługi pojawia się dość często w układach dynamicznych . Nie jest łatwo ustalić, czy system ma miarę prawdopodobieństwa, a główny problem jest następujący. Niech będą chwilami w czasie i podzbiorem wsparcia; gdyby dla systemu istniała miara prawdopodobieństwa, należałoby oczekiwać, że częstość obserwowanych stanów w zbiorze będzie równa w przedziale i , co może się nie zdarzyć; na przykład może oscylować podobnie do sinusa, , którego granica nie jest zbieżna. Formalnie miara istnieje tylko wtedy, gdy granica względnej częstotliwości zbiega się, gdy system jest obserwowany w nieskończonej przyszłości. Gałąź układów dynamicznych badająca istnienie miary prawdopodobieństwa to teoria ergodyczna .

Należy zauważyć, że nawet w tych przypadkach rozkład prawdopodobieństwa, jeśli istnieje, może nadal być określany jako „ciągły” lub „dyskretny” w zależności od tego, czy wsparcie jest odpowiednio niepoliczalne czy policzalne.

Generowanie liczb losowych

Większość algorytmów opiera się na generatorze liczb pseudolosowych, który generuje liczby X, które są równomiernie rozłożone w przedziale półotwartym [0,1). Te zmienne losowe X są następnie przekształcane za pomocą pewnego algorytmu, aby utworzyć nową zmienną losową o wymaganym rozkładzie prawdopodobieństwa. Dzięki temu źródłu jednolitej pseudolosowości można generować realizacje dowolnej zmiennej losowej.

Załóżmy na przykład, że ma rozkład jednostajny między 0 a 1. Aby skonstruować losową zmienną Bernoulliego dla niektórych , definiujemy

aby

Ta zmienna losowa X ma rozkład Bernoulliego z parametrem . Zauważ, że jest to transformacja dyskretnej zmiennej losowej.

W przypadku funkcji rozkładu ciągłej zmiennej losowej należy skonstruować ciągłą zmienną losową. , funkcja odwrotna , odnosi się do zmiennej jednorodnej :

Załóżmy na przykład, że musi zostać skonstruowana zmienna losowa, która ma rozkład wykładniczy .

więc i jeśli ma rozkład, to zmienna losowa jest zdefiniowana przez . Ma to rozkład wykładniczy .

Częstym problemem w symulacjach statystycznych ( metoda Monte Carlo ) jest generowanie liczb pseudolosowych o określonym rozkładzie.

Powszechne rozkłady prawdopodobieństwa i ich zastosowania

Pojęcie rozkładu prawdopodobieństwa i zmiennych losowych, które one opisują, leży u podstaw matematycznej dyscypliny teorii prawdopodobieństwa i nauki o statystyce. Istnieje rozpiętość lub zmienność prawie każdej wartości, którą można zmierzyć w populacji (np. wzrost ludzi, trwałość metalu, wzrost sprzedaży, natężenie ruchu itp.); prawie wszystkie pomiary są dokonywane z pewnym błędem wewnętrznym; w fizyce wiele procesów jest opisanych probabilistycznie, od właściwości kinetycznych gazów po kwantowo-mechaniczny opis cząstek elementarnych . Z tych i wielu innych powodów proste liczby są często niewystarczające do opisania wielkości, podczas gdy rozkłady prawdopodobieństwa są często bardziej odpowiednie.

Poniżej znajduje się lista niektórych z najczęstszych rozkładów prawdopodobieństwa, pogrupowanych według typu procesu, z którym są powiązane. Aby uzyskać pełniejszą listę, zobacz listę rozkładów prawdopodobieństwa , które grupują według charakteru rozważanego wyniku (dyskretny, ciągły, wielowymiarowy itp.)

Wszystkie poniższe rozkłady jednowymiarowe mają pojedynczą wartość szczytową; to znaczy zakłada się, że wartości skupiają się wokół jednego punktu. W praktyce faktycznie obserwowane wielkości mogą skupiać się wokół wielu wartości. Takie wielkości można modelować za pomocą rozkładu mieszaniny .

Wzrost liniowy (np. błędy, przesunięcia)

Wzrost wykładniczy (np. ceny, dochody, populacje)

Ilości równomiernie rozłożone

Próby Bernoulliego (tak/nie zdarzenia, z określonym prawdopodobieństwem)

Wyniki kategoryczne (zdarzenia z K możliwych wyników)

Proces Poissona (zdarzenia, które występują niezależnie z zadaną szybkością)

  • Rozkład Poissona , dla liczby wystąpień zdarzenia typu Poissona w danym okresie czasu
  • Rozkład wykładniczy , dla czasu przed wystąpieniem następnego zdarzenia typu Poissona
  • Rozkład gamma , dla czasu przed wystąpieniem kolejnych k zdarzeń typu Poissona

Wartości bezwzględne wektorów o składowych o rozkładzie normalnym

  • Rozkład Rayleigha , dla rozkładu wielkości wektorowych z komponentami ortogonalnymi o rozkładzie Gaussa. Rozkłady Rayleigha znajdują się w sygnałach RF ze składowymi rzeczywistymi i urojonymi Gaussa.
  • Dystrybucja ryżu , uogólnienie rozkładów Rayleigha dla miejsc, w których występuje nieruchomy składnik sygnału tła. Znaleziony w Rician zanikanie sygnałów radiowych z powodu propagacji wielościeżkowej oraz w obrazach MR z zniekształceniem szumu na niezerowych sygnałach NMR.

Wielkości o normalnym rozkładzie operowane sumą kwadratów

Jako sprzężone rozkłady a priori we wnioskowaniu bayesowskim

Niektóre specjalistyczne zastosowania rozkładów prawdopodobieństwa

  • Te modele językowe cache i inne modele językowe statystyczne wykorzystywane w przetwarzaniu języka naturalnego , aby przypisać do prawdopodobieństwa wystąpienia poszczególnych słów i sekwencji słownych zrobić za pomocą rozkładów prawdopodobieństwa.
  • W mechanice kwantowej gęstość prawdopodobieństwa znalezienia cząstki w danym punkcie jest proporcjonalna do kwadratu wielkości funkcji falowej cząstki w tym punkcie (patrz reguła Borna ). W związku z tym funkcja rozkładu prawdopodobieństwa pozycji cząstki jest opisana przez , prawdopodobieństwo, że pozycja cząstki x będzie w przedziale axbw wymiarze pierwszym, oraz podobna całka potrójna w wymiarze trzecim. To kluczowa zasada mechaniki kwantowej.
  • Probabilistyczny przepływ obciążenia w badaniu rozpływu mocy wyjaśnia niepewności zmiennych wejściowych jako rozkład prawdopodobieństwa i zapewnia obliczenie rozpływu mocy również pod względem rozkładu prawdopodobieństwa.
  • Przewidywanie występowania zjawisk naturalnych na podstawie wcześniejszych rozkładów częstotliwości, takich jak cyklony tropikalne , grad, czas pomiędzy zdarzeniami itp.

Zobacz też

Listy

Bibliografia

Cytaty

Źródła

  • Den Dekker, AJ; Sijbers, J. (2014). „Rozkłady danych w obrazach rezonansu magnetycznego: przegląd”. Physica Medica . 30 (7): 725–741. doi : 10.1016/j.ejmp.2014.05.002 . PMID  25059432 .
  • Vapnik, Władimir Naumowicz (1998). Statystyczna teoria uczenia się . John Wiley i Synowie.

Zewnętrzne linki