Wielowymiarowy model probitowy - Multivariate probit model

W statystyce i ekonometrii The wieloczynnikowej model probitowy jest uogólnieniem modelu probitowa wykorzystywanym do oszacowania kilku skorelowanych wyników binarnych wspólnie. Przykładowo, jeśli uważa się, że decyzje o wysłaniu co najmniej jednego dziecka do szkoły publicznej i głosowaniu za budżetem szkolnym są skorelowane (obie decyzje są binarne), to do wspólnego przewidywania tych decyzji odpowiedni byłby wielowymiarowy model probitowy. dwa wybory w zależności od indywidualnej sytuacji. JR Ashford i RR Sowden początkowo zaproponowali podejście do wielowymiarowej analizy probitowej. Siddhartha Chib i Edward Greenberg rozszerzyli ten pomysł, a także zaproponowali metody wnioskowania oparte na symulacji dla wielowymiarowego modelu probitowego, które uprościły i uogólniły estymację parametrów.

Przykład: bivariate probit

W zwykłym modelu probit istnieje tylko jedna binarna zmienna zależna, więc używana jest tylko jedna zmienna latentna . Z kolei w dwuwymiarowym modelu probitowym istnieją dwie binarne zmienne zależne, a więc dwie zmienne latentne: i . Zakłada się, że każda obserwowana zmienna przyjmuje wartość 1 wtedy i tylko wtedy, gdy jej bazowa ciągła zmienna latentna przyjmuje wartość dodatnią: ${\ displaystyle Y}$ ${\ Displaystyle Y ^ {*}}$ ${\ displaystyle Y_ {1}}$ ${\ displaystyle Y_ {2}}$ ${\ Displaystyle Y_ {1} ^ {*}}$ ${\ Displaystyle Y_ {2} ^ {*}}$

{\ Displaystyle Y_ {1} = {\ rozpocząć {przypadków} 1 i {\ tekst {if}} Y_ {1} ^ {*}> 0, \\ 0 i {\ tekst {inaczej}}, \ koniec {przypadków}} }

{\ Displaystyle Y_ {2} = {\ rozpocząć {przypadków} 1 i {\ tekst {if}} Y_ {2} ^ {*}> 0, \\ 0 i {\ tekst {inaczej}}, \ koniec {przypadków}} }

z

{\ displaystyle {\ begin {przypadków} Y_ {1} ^ {*} = X_ {1} \ beta _ {1} + \ varepsilon _ {1} \\ Y_ {2} ^ {*} = X_ {2} \ beta _ {2} + \ varepsilon _ {2} \ end {sprawy}}}

i

{\ displaystyle {\ begin {bmatrix} \ varepsilon _ {1} \\\ varepsilon _ {2} \ end {bmatrix}} \ mid X \ sim {\ mathcal {N}} \ left ({\ begin {bmatrix} 0 \\ 0 \ end {bmatrix}}, {\ begin {bmatrix} 1 & \ rho \\\ rho & 1 \ end {bmatrix}} \ right)}

Dopasowanie dwuwymiarowego modelu probitowego obejmuje oszacowanie wartości i . Aby to zrobić, należy zmaksymalizować prawdopodobieństwo modelu . To prawdopodobieństwo jest ${\ displaystyle \ beta _ {1}, \ \ beta _ {2},}$ ${\ displaystyle \ rho}$

{\ Displaystyle {\ rozpocząć {wyrównane} L (\ beta _ {1}, \ beta _ {2}) = {\ Big (} \ prod & P (Y_ {1} = 1, Y_ {2} = 1 \ mid \ beta _ {1}, \ beta _ {2}) ^ {Y_ {1} Y_ {2}} P (Y_ {1} = 0, Y_ {2} = 1 \ mid \ beta _ {1}, \ beta _ {2}) ^ {(1-Y_ {1}) Y_ {2}} \\ [8pt] & {} \ qquad P (Y_ {1} = 1, Y_ {2} = 0 \ mid \ beta _ {1}, \ beta _ {2}) ^ {Y_ {1} (1-Y_ {2})} P (Y_ {1} = 0, Y_ {2} = 0 \ mid \ beta _ {1} , \ beta _ {2}) ^ {(1-Y_ {1}) (1-Y_ {2})} {\ Big)} \ end {aligned}}}

Podstawiając zmienne ukryte i w funkcji prawdopodobieństwa i biorąc dzienniki daje ${\ Displaystyle Y_ {1} ^ {*}}$ ${\ Displaystyle Y_ {2} ^ {*}}$

{\ Displaystyle {\ rozpocząć {wyrównane} \ sum & {\ Big (} Y_ {1} Y_ {2} \ ln P (\ varepsilon _ {1}> - X_ {1} \ beta _ {1}, \ varepsilon) _ {2}> - X_ {2} \ beta _ {2}) \\ [4pt] & {} \ quad {} + (1-Y_ {1}) Y_ {2} \ ln P (\ varepsilon _ { 1} <- X_ {1} \ beta _ {1}, \ varepsilon _ {2}> - X_ {2} \ beta _ {2}) \\ [4pt] & {} \ quad {} + Y_ {1 } (1-Y_ {2}) \ ln P (\ varepsilon _ {1}> - X_ {1} \ beta _ {1}, \ varepsilon _ {2} <- X_ {2} \ beta _ {2} ) \\ [4pt] & {} \ quad {} + (1-Y_ {1}) (1-Y_ {2}) \ ln P (\ varepsilon _ {1} <- X_ {1} \ beta _ { 1}, \ varepsilon _ {2} <- X_ {2} \ beta _ {2}) {\ Big)}. \ End {aligned}}}

Po pewnym przepisaniu funkcja logarytmu prawdopodobieństwa staje się następująca:

{\ Displaystyle {\ rozpocząć {wyrównane} \ sum & {\ Big (} Y_ {1} Y_ {2} \ ln \ Phi (X_ {1} \ beta _ {1}, X_ {2} \ beta _ {2) }, \ rho) \\ [4pt] & {} \ quad {} + (1-Y_ {1}) Y_ {2} \ ln \ Phi (-X_ {1} \ beta _ {1}, X_ {2 } \ beta _ {2}, - \ rho) \\ [4pt] & {} \ quad {} + Y_ {1} (1-Y_ {2}) \ ln \ Phi (X_ {1} \ beta _ { 1}, - X_ {2} \ beta _ {2}, - \ rho) \\ [4pt] & {} \ quad {} + (1-Y_ {1}) (1-Y_ {2}) \ ln \ Phi (-X_ {1} \ beta _ {1}, - X_ {2} \ beta _ {2}, \ rho) {\ Big)}. \ End {aligned}}}

Należy pamiętać, że jest Dystrybuanta z dwuwymiarowym rozkładzie normalnym . aw funkcji logarytmicznej wiarygodności obserwowane zmienne są równe jeden lub zero. ${\ displaystyle \ Phi}$ ${\ displaystyle Y_ {1}}$ ${\ displaystyle Y_ {2}}$

Probit wielowymiarowy

W przypadku ogólnym, w którym możemy przyjąć jako wybory i jako jednostki lub obserwacje, prawdopodobieństwo obserwacji wyboru wynosi ${\ Displaystyle \ mathbf {r_ {i}} = (y_ {1}, ..., y_ {j}), \ (i = 1, ..., N)}$ ${\ displaystyle j}$ ${\ displaystyle i}$ ${\ displaystyle \ mathbf {y_ {i}}}$

{\ Displaystyle {\ rozpocząć {wyrównane} \ Pr (\ mathbf {y_ {i}} | \ mathbf {X_ {i} \ beta}, \ Sigma) = i \ int _ {A_ {J}} \ cdots \ int _ {A_ {1}} f_ {N} (\ mathbf {y} _ {i} ^ {*} | \ mathbf {X_ {i} \ beta}, \ Sigma) dy_ {1} ^ {*} \ dots dy_ {J} ^ {*} \\\ Pr (\ mathbf {y_ {i}} | \ mathbf {X_ {i} \ beta}, \ Sigma) = & \ int \ mathbb {1} _ {y ^ { *} \ in A} f_ {N} (\ mathbf {y} _ {i} ^ {*} | \ mathbf {X_ {i} \ beta}, \ Sigma) d \ mathbf {y} _ {i} ^ {*} \ end {aligned}}}

Gdzie i ${\ Displaystyle A = A_ {1} \ razy \ cdots \ razy A_ {J}}$

{\ Displaystyle A_ {j} = {\ rozpocząć {przypadków} (- \ infty, 0] i y_ {j} ^ {*} = 0 \\ (0, \ infty) i y_ {j} ^ {*} = 1 \ koniec {sprawy}}}

W tym przypadku funkcja logarytmu wiarygodności byłaby ${\ Displaystyle \ sum _ {i = 1} ^ {N} \ log \ Pr (\ mathbf {y_ {i}} | \ mathbf {X_ {i} \ beta}, \ Sigma)}$

Z wyjątkiem zazwyczaj nie ma rozwiązania w postaci zamkniętej całek w równaniu logarytmiczno-prawdopodobieństwa. Zamiast tego do symulacji prawdopodobieństw wyboru można zastosować metody symulacyjne. Metody wykorzystujące próbkowanie według ważności obejmują algorytm GHK (Geweke, Hajivassilou, McFadden i Keane), AR (akceptacja-odrzucenie), metoda Sterna. Istnieją również podejścia MCMC do tego problemu, w tym CRB (metoda Chiba z Rao-Blackwellization), CRT (Chib, Ritter, Tanner), ARK (jądro akceptacji-odrzucenia) i ASK (jądro próbkowania adaptacyjnego). W Probit-LMM (Mandt, Wenzel, Nakajima et al.) Zaproponowano wariacyjne podejście do skalowania do dużych zbiorów danych. ${\ displaystyle J \ leq 2}$

Bibliografia

^ Ashford, JR; Sowden, RR (wrzesień 1970). „Wielowymiarowa analiza probitów” . Cite Journal wymaga |journal= ( pomoc )
^ Chib Siddhartha; Greenberg, Edward (czerwiec 1998). „Analiza wielowymiarowych modeli probitowych” . Biometrika . 85 (2): 347–361. CiteSeerX 10.1.1.198.8541 . doi : 10.1093 / biomet / 85.2.347 - via Oxford Academic.
^ Hajivassiliou, Vassilis (1994). „Rozdział 40 Klasyczne metody estymacji modeli LDV z wykorzystaniem symulacji”. Podręcznik ekonometrii . 4 : 2383–2441. doi : 10.1016 / S1573-4412 (05) 80009-1 . ISBN 9780444887665 .
^ Jeliazkov, Ivan (2010). „Perspektywy MCMC dotyczące symulowanego oszacowania prawdopodobieństwa”. Postępy w ekonometrii . 26 : 3–39. doi : 10.1108 / S0731-9053 (2010) 0000026005 . ISBN 978-0-85724-149-8 .
^ Mandt, Stephan; Wenzel, Florian; Nakajima, Shinichi; John, Cunningham; Lippert, Christoph; Kloft, Marius (2017). „Liniowy model mieszany rzadkich probitów” (PDF) . Uczenie maszynowe . 106 (9–10): 1–22. arXiv : 1507.04777 . doi : 10.1007 / s10994-017-5652-6 .

Dalsza lektura

Greene, William H., Econometric Analysis , siódma edycja, Prentice-Hall, 2012.

[1] Ashford, JR; Sowden, RR (wrzesień 1970). „Wielowymiarowa analiza probitów” . Cite Journal wymaga |journal= ( pomoc )

[2] Chib Siddhartha; Greenberg, Edward (czerwiec 1998). „Analiza wielowymiarowych modeli probitowych” . Biometrika . 85 (2): 347–361. CiteSeerX 10.1.1.198.8541 . doi : 10.1093 / biomet / 85.2.347 - via Oxford Academic.

[3] Hajivassiliou, Vassilis (1994). „Rozdział 40 Klasyczne metody estymacji modeli LDV z wykorzystaniem symulacji”. Podręcznik ekonometrii . 4 : 2383–2441. doi : 10.1016 / S1573-4412 (05) 80009-1 . ISBN 9780444887665 .

[4] Jeliazkov, Ivan (2010). „Perspektywy MCMC dotyczące symulowanego oszacowania prawdopodobieństwa”. Postępy w ekonometrii . 26 : 3–39. doi : 10.1108 / S0731-9053 (2010) 0000026005 . ISBN 978-0-85724-149-8 .

[5] Mandt, Stephan; Wenzel, Florian; Nakajima, Shinichi; John, Cunningham; Lippert, Christoph; Kloft, Marius (2017). „Liniowy model mieszany rzadkich probitów” (PDF) . Uczenie maszynowe . 106 (9–10): 1–22. arXiv : 1507.04777 . doi : 10.1007 / s10994-017-5652-6 .

Languages

In other projects

Wielowymiarowy model probitowy - Multivariate probit model

Zawartość

Przykład: bivariate probit

Probit wielowymiarowy

Bibliografia

Dalsza lektura