Wielowymiarowy model probitowy - Multivariate probit model

W statystyce i ekonometrii The wieloczynnikowej model probitowy jest uogólnieniem modelu probitowa wykorzystywanym do oszacowania kilku skorelowanych wyników binarnych wspólnie. Przykładowo, jeśli uważa się, że decyzje o wysłaniu co najmniej jednego dziecka do szkoły publicznej i głosowaniu za budżetem szkolnym są skorelowane (obie decyzje są binarne), to do wspólnego przewidywania tych decyzji odpowiedni byłby wielowymiarowy model probitowy. dwa wybory w zależności od indywidualnej sytuacji. JR Ashford i RR Sowden początkowo zaproponowali podejście do wielowymiarowej analizy probitowej. Siddhartha Chib i Edward Greenberg rozszerzyli ten pomysł, a także zaproponowali metody wnioskowania oparte na symulacji dla wielowymiarowego modelu probitowego, które uprościły i uogólniły estymację parametrów.

Przykład: bivariate probit

W zwykłym modelu probit istnieje tylko jedna binarna zmienna zależna, więc używana jest tylko jedna zmienna latentna . Z kolei w dwuwymiarowym modelu probitowym istnieją dwie binarne zmienne zależne, a więc dwie zmienne latentne: i . Zakłada się, że każda obserwowana zmienna przyjmuje wartość 1 wtedy i tylko wtedy, gdy jej bazowa ciągła zmienna latentna przyjmuje wartość dodatnią:

z

i

Dopasowanie dwuwymiarowego modelu probitowego obejmuje oszacowanie wartości i . Aby to zrobić, należy zmaksymalizować prawdopodobieństwo modelu . To prawdopodobieństwo jest

Podstawiając zmienne ukryte i w funkcji prawdopodobieństwa i biorąc dzienniki daje

Po pewnym przepisaniu funkcja logarytmu prawdopodobieństwa staje się następująca:

Należy pamiętać, że jest Dystrybuanta z dwuwymiarowym rozkładzie normalnym . aw funkcji logarytmicznej wiarygodności obserwowane zmienne są równe jeden lub zero.

Probit wielowymiarowy

W przypadku ogólnym, w którym możemy przyjąć jako wybory i jako jednostki lub obserwacje, prawdopodobieństwo obserwacji wyboru wynosi

Gdzie i

W tym przypadku funkcja logarytmu wiarygodności byłaby

Z wyjątkiem zazwyczaj nie ma rozwiązania w postaci zamkniętej całek w równaniu logarytmiczno-prawdopodobieństwa. Zamiast tego do symulacji prawdopodobieństw wyboru można zastosować metody symulacyjne. Metody wykorzystujące próbkowanie według ważności obejmują algorytm GHK (Geweke, Hajivassilou, McFadden i Keane), AR (akceptacja-odrzucenie), metoda Sterna. Istnieją również podejścia MCMC do tego problemu, w tym CRB (metoda Chiba z Rao-Blackwellization), CRT (Chib, Ritter, Tanner), ARK (jądro akceptacji-odrzucenia) i ASK (jądro próbkowania adaptacyjnego). W Probit-LMM (Mandt, Wenzel, Nakajima et al.) Zaproponowano wariacyjne podejście do skalowania do dużych zbiorów danych.

Bibliografia

  1. ^ Ashford, JR; Sowden, RR (wrzesień 1970). „Wielowymiarowa analiza probitów” . Cite Journal wymaga |journal= ( pomoc )
  2. ^ Chib Siddhartha; Greenberg, Edward (czerwiec 1998). „Analiza wielowymiarowych modeli probitowych” . Biometrika . 85 (2): 347–361. CiteSeerX   10.1.1.198.8541 . doi : 10.1093 / biomet / 85.2.347 - via Oxford Academic.
  3. ^ Hajivassiliou, Vassilis (1994). „Rozdział 40 Klasyczne metody estymacji modeli LDV z wykorzystaniem symulacji”. Podręcznik ekonometrii . 4 : 2383–2441. doi : 10.1016 / S1573-4412 (05) 80009-1 . ISBN   9780444887665 .
  4. ^ Jeliazkov, Ivan (2010). „Perspektywy MCMC dotyczące symulowanego oszacowania prawdopodobieństwa”. Postępy w ekonometrii . 26 : 3–39. doi : 10.1108 / S0731-9053 (2010) 0000026005 . ISBN   978-0-85724-149-8 .
  5. ^ Mandt, Stephan; Wenzel, Florian; Nakajima, Shinichi; John, Cunningham; Lippert, Christoph; Kloft, Marius (2017). „Liniowy model mieszany rzadkich probitów” (PDF) . Uczenie maszynowe . 106 (9–10): 1–22. arXiv : 1507.04777 . doi : 10.1007 / s10994-017-5652-6 .

Dalsza lektura

  • Greene, William H., Econometric Analysis , siódma edycja, Prentice-Hall, 2012.