Model mieszany - Mixed model

Model mieszany , modelu efektów mieszanych lub model mieszany błędów składnikiem jest model statystyczny zawierający zarówno efektów stałych i efektów losowych . Modele te są przydatne w wielu różnych dyscyplinach nauk fizycznych, biologicznych i społecznych. Są one szczególnie przydatne w sytuacjach, w których powtarzane pomiary są dokonywane na tych samych jednostkach statystycznych ( badanie podłużne ) lub gdy pomiary są wykonywane na klastrach powiązanych jednostek statystycznych. Ze względu na ich przewagę w radzeniu sobie z brakami danych, modele efektów mieszanych są często preferowane w stosunku do bardziej tradycyjnych metod, takich jak analiza wariancji z powtarzanymi pomiarami .

Na tej stronie omówione zostaną głównie liniowe modele efektów mieszanych (LMEM) zamiast uogólnionych liniowych modeli mieszanych lub nieliniowych modeli efektów mieszanych .

Historia i aktualny stan

Ronald Fisher wprowadził modele efektów losowych do badania korelacji wartości cech między krewnymi. W 1950 roku Charles Roy Henderson warunkiem najlepsze liniowe bezstronne szacunki z efektami stałymi i najlepszych liniowych bezstronnych przewidywaniami losowych efektów. Następnie modelowanie mieszane stało się głównym obszarem badań statystycznych, w tym pracami nad obliczaniem szacunków największego prawdopodobieństwa, nieliniowymi modelami efektów mieszanych, brakami danych w modelach efektów mieszanych oraz estymacją bayesowską modeli efektów mieszanych. Modele mieszane są stosowane w wielu dyscyplinach, w których dla każdej jednostki będącej przedmiotem zainteresowania wykonuje się wiele skorelowanych pomiarów. Są one powszechnie wykorzystywane w badaniach z udziałem ludzi i zwierząt w dziedzinach od genetyki po marketing, a także w statystykach baseballowych i przemysłowych.

Definicja

W notacji macierzowej liniowy model mieszany można przedstawić jako

gdzie

  • jest znanym wektorem obserwacji o średniej ;
  • jest nieznanym wektorem efektów stałych;
  • jest nieznanym wektorem efektów losowych, ze średnią i macierzą wariancji–kowariancji ;
  • jest nieznanym wektorem błędów losowych, ze średnią i wariancją ;
  • i są znanymi macierzami projektu odnoszącymi się do obserwacji odpowiednio do i .

Oszacowanie

Gęstość łączną i można zapisać jako: . Zakładając normalność, , i , oraz maksymalizując gęstość połączenia nad i , otrzymujemy „równania modelu mieszanego” Hendersona (MME) dla liniowych modeli mieszanych:

Rozwiązania dla MME i są najlepszymi liniowymi nieobciążonymi oszacowaniami i predyktorami odpowiednio dla i . Jest to konsekwencją twierdzenia Gaussa-Markowa, gdy warunkowa wariancja wyniku nie jest skalowalna do macierzy tożsamości. Gdy znana jest wariancja warunkowa, najlepszymi liniowymi nieobciążonymi oszacowaniami jest oszacowanie metodą najmniejszych kwadratów ważone odwrotną wariancją. Jednak wariancja warunkowa jest rzadko, jeśli w ogóle, znana. Pożądane jest więc wspólne oszacowanie wariancji i ważonych oszacowań parametrów podczas rozwiązywania MME.

Jedną z metod stosowanych do dopasowania takich mieszanych modeli jest algorytm oczekiwano-maksymalizacji, w którym komponenty wariancji są traktowane jako nieobserwowane parametry uciążliwości w łącznym prawdopodobieństwie. Obecnie jest to zaimplementowana metoda dla głównych pakietów oprogramowania statystycznego R (lme w pakiecie nlme lub liniowych efektów mieszanych w pakiecie lme4), Python ( pakiet statsmodels ), Julia (pakiet MixedModels.jl) i SAS (proc. mieszany). Rozwiązaniem równań modelu mieszanego jest oszacowanie maksymalnego prawdopodobieństwa, gdy rozkład błędów jest normalny.

Zobacz też

Bibliografia

Dalsza lektura

  • Gałecki, Andrzej; Burzykowski, Tomasz (2013). Liniowe modele efektów mieszanych z wykorzystaniem R: podejście krok po kroku . Nowy Jork: Springer. Numer ISBN 978-1-4614-3900-4.
  • Milliken, GA; Johnson, DE (1992). Analiza niechlujnych danych: tom. I. Zaprojektowane eksperymenty . Nowy Jork: Chapman i Hall.
  • Zachód, BT; Welch, KB; Gałecki AT (2007). Liniowe modele mieszane: praktyczny przewodnik dotyczący oprogramowania statystycznego . Nowy Jork: Chapman & Hall/CRC.