Wielowymiarowy model probitowy - Multivariate probit model
Ten artykuł dotyczy modelowania kilku skorelowanych wyników binarnych. Aby modelować pojedyncze zdarzenie z wieloma wynikami, zobacz wielomianowy probit .
W statystyce i ekonometrii The wieloczynnikowej model probitowy jest uogólnieniem modelu probitowa wykorzystywanym do oszacowania kilku skorelowanych wyników binarnych wspólnie. Przykładowo, jeśli uważa się, że decyzje o wysłaniu co najmniej jednego dziecka do szkoły publicznej i głosowaniu za budżetem szkolnym są skorelowane (obie decyzje są binarne), to do wspólnego przewidywania tych decyzji odpowiedni byłby wielowymiarowy model probitowy. dwa wybory w zależności od indywidualnej sytuacji. JR Ashford i RR Sowden początkowo zaproponowali podejście do wielowymiarowej analizy probitowej. Siddhartha Chib i Edward Greenberg rozszerzyli ten pomysł, a także zaproponowali metody wnioskowania oparte na symulacji dla wielowymiarowego modelu probitowego, które uprościły i uogólniły estymację parametrów.
W zwykłym modelu probit istnieje tylko jedna binarna zmienna zależna, więc używana jest tylko jedna zmienna latentna . Z kolei w dwuwymiarowym modelu probitowym istnieją dwie binarne zmienne zależne, a więc dwie zmienne latentne: i . Zakłada się, że każda obserwowana zmienna przyjmuje wartość 1 wtedy i tylko wtedy, gdy jej bazowa ciągła zmienna latentna przyjmuje wartość dodatnią:
W przypadku ogólnym, w którym możemy przyjąć jako wybory i jako jednostki lub obserwacje, prawdopodobieństwo obserwacji wyboru wynosi
Gdzie i
W tym przypadku funkcja logarytmu wiarygodności byłaby
Z wyjątkiem zazwyczaj nie ma rozwiązania w postaci zamkniętej całek w równaniu logarytmiczno-prawdopodobieństwa. Zamiast tego do symulacji prawdopodobieństw wyboru można zastosować metody symulacyjne. Metody wykorzystujące próbkowanie według ważności obejmują algorytm GHK (Geweke, Hajivassilou, McFadden i Keane), AR (akceptacja-odrzucenie), metoda Sterna. Istnieją również podejścia MCMC do tego problemu, w tym CRB (metoda Chiba z Rao-Blackwellization), CRT (Chib, Ritter, Tanner), ARK (jądro akceptacji-odrzucenia) i ASK (jądro próbkowania adaptacyjnego). W Probit-LMM (Mandt, Wenzel, Nakajima et al.) Zaproponowano wariacyjne podejście do skalowania do dużych zbiorów danych.