Odchylenie wartości średniokwadratowej - Root-mean-square deviation

Odchylenie korzeń średnią kwadratową ( RMSD ) lub korzeń średnią kwadratową błędów ( RMSE ) jest często stosowanym miernikiem różnic między wartościami (próbki lub wartości populacyjnych) przewidywane przez model lub estymatora a wartościami obserwowanymi. RMSD reprezentuje pierwiastek kwadratowy z drugiego momentu próbki różnic między wartościami przewidywanymi a wartościami obserwowanymi lub średnią kwadratową tych różnic. Te odchylenia są nazywane pozostałości gdy obliczenia wykonywane są na próbce danych, który został użyty do oszacowania i nazywane są błędy (lub błędów predykcji), gdy obliczony out-of-sample. RMSD służy do agregowania wielkości błędów w prognozach dla różnych punktów danych w jedną miarę mocy predykcyjnej. RMSD to miara dokładności służąca do porównywania błędów prognozowania różnych modeli dla konkretnego zestawu danych, a nie między zestawami danych, ponieważ jest zależna od skali.

RMSD jest zawsze nieujemna, a wartość 0 (prawie nigdy nie osiągnięta w praktyce) wskazywałaby na idealne dopasowanie do danych. Ogólnie rzecz biorąc, niższy RMSD jest lepszy niż wyższy. Jednak porównania różnych typów danych byłyby nieprawidłowe, ponieważ miara zależy od skali użytych liczb.

RMSD to pierwiastek kwadratowy ze średniej kwadratów błędów. Wpływ każdego błędu na RMSD jest proporcjonalny do wielkości kwadratu błędu; zatem większe błędy mają nieproporcjonalnie duży wpływ na RMSD. W związku z tym RMSD jest wrażliwy na wartości odstające.

Formuła

RMSD estymatora w odniesieniu do szacowanego parametru jest definiowana jako pierwiastek kwadratowy błędu średniokwadratowego : ${\kapelusz {\theta}}$ $\theta$

{\ Displaystyle \ operatorname {RMSD} ({\ hat {\ theta}}) = {\ sqrt {\ operatorname {MSE} ({\ hat {\ theta}})}} = {\ sqrt {\ operatorname {E} (({\hat {\theta }}-\theta )^{2})}}.}

W przypadku nieobciążonego estymatora RMSD jest pierwiastkiem kwadratowym wariancji, znanym jako odchylenie standardowe .

RMSD przewidywanych wartości dla czasu t od A regresji jest zmienną zależną ze zmiennymi obserwowane przez T czas, jest obliczana dla T różnych przewidywania jako pierwiastka kwadratowego średniej kwadratów odchyleń: ${\ Displaystyle {\ kapelusz {y}} _ {t}}$ $y_{t}$

{\ Displaystyle \ operatorname {RMSD} = {\ sqrt {\ Frac {\ suma _ {t = 1} ^ {T} ({\ kapelusz {y}} _ {t}-y_ {t}) ^ {2} }{T}}}.}

(W przypadku regresji na danych przekrojowych indeks dolny t jest zastępowany przez i , a T przez n .)

W niektórych dyscyplinach RMSD służy do porównywania różnic między dwiema rzeczami, które mogą się różnić, z których żadna nie jest akceptowana jako „standard”. Na przykład, mierząc średnią różnicę między dwoma szeregami czasowymi i , formuła staje się $x_{1,t}$ $x_{2,t}$

{\ Displaystyle \ Operatorname {RMSD} = {\ sqrt {\ Frac {\ suma _ {t = 1} ^ {T} (x_ {1, t} -x_ {2, t}) ^ {2}} {T }}}.}

Normalizacja

Normalizacja RMSD ułatwia porównanie zestawów danych lub modeli o różnych skalach. Chociaż w literaturze nie ma spójnych sposobów normalizacji, powszechnymi wyborami są średnia lub zakres (zdefiniowany jako wartość maksymalna minus wartość minimalna) zmierzonych danych:

{\ Displaystyle \ operatorname {NRMSD} = {\ Frac {\ operatorname {RMSD}} {y_ {\ max}-y_ {\ min}}}}

lub .

{\ Displaystyle \ operatorname {NRMSD} = {\ Frac {\ operatorname {RMSD}} {\ bar {y}}}}

Wartość ta jest powszechnie określana jako znormalizowane odchylenie średniokwadratowe lub błąd (NRMSD lub NRMSE) i często wyrażana w procentach, gdzie niższe wartości wskazują na mniejszą wariancję resztową. W wielu przypadkach, zwłaszcza w przypadku mniejszych próbek, na zakres próbki może mieć wpływ wielkość próbki, co utrudniałoby porównania.

Inną możliwą metodą uczynienia RMSD bardziej użyteczną miarą porównawczą jest podzielenie RMSD przez rozstęp międzykwartylowy . Podczas dzielenia RMSD przez IQR znormalizowana wartość staje się mniej wrażliwa na wartości ekstremalne w zmiennej docelowej.

{\ Displaystyle \ operatorname {RMSDIQR} = {\ Frac {\ operatorname {RMSD}} {IQR}}}

gdzie

{\ Displaystyle IQR = Q_ {3}-Q_ {1}}

z i gdzie CDF ^-1 jest odwrotna dystrybuanta . ${\ Displaystyle Q_ {1} = {\ tekst {CDF}} ^ {-1} (0,25)}$ ${\ Displaystyle Q_ {3} = {\ tekst {CDF}} ^ {-1} (0,75),}$

Normalizując przez średnią wartość pomiarów, można zastosować termin współczynnik zmienności RMSD, CV(RMSD), aby uniknąć niejednoznaczności. Jest to analogiczne do współczynnika zmienności, w którym RMSD zastępuje odchylenie standardowe .

{\ Displaystyle \ operatorname {CV (RMSD)} = {\ Frac {\ operatorname {RMSD}} {\ pasek {y}}}.}

Średni błąd bezwzględny

Niektórzy badacze zalecali stosowanie średniego błędu bezwzględnego (MAE) zamiast odchylenia średniokwadratowego. MAE ma przewagę w interpretacji nad RMSD. MAE jest średnią wartości bezwzględnych błędów. MAE jest zasadniczo łatwiejszy do zrozumienia niż pierwiastek kwadratowy ze średniej kwadratów błędów. Ponadto każdy błąd wpływa na MAE wprost proporcjonalnie do wartości bezwzględnej błędu, co nie ma miejsca w przypadku RMSD.

Aplikacje

W meteorologii , aby zobaczyć , jak skutecznie model matematyczny przewiduje zachowanie atmosfery .
W bioinformatyki The odchylenia średniego pierwiastka kwadratowego z pozycji atomów jest miarą średniej odległości pomiędzy atomami nałożonych białek .
W konstrukcji opiera Drug Design, The RMSD jest miarą różnicy pomiędzy pokroju kryształu ligand konformacji i dokującej predykcji.
W ekonomii RMSD służy do określenia, czy model ekonomiczny pasuje do wskaźników ekonomicznych . Niektórzy eksperci twierdzą, że RMSD jest mniej niezawodny niż Relative Absolute Error.
W psychologii eksperymentalnej RMSD służy do oceny, jak dobrze matematyczne lub obliczeniowe modele zachowania wyjaśniają empirycznie obserwowane zachowanie.
W GIS RMSD jest jedną z miar stosowanych do oceny dokładności analizy przestrzennej i teledetekcji.
W hydrogeologii RMSD i NRMSD są używane do oceny kalibracji modelu wód gruntowych.
W nauce o obrazowaniu RMSD jest częścią szczytowego stosunku sygnału do szumu , miary stosowanej do oceny skuteczności metody rekonstrukcji obrazu w stosunku do obrazu oryginalnego.
W neuronauce obliczeniowej RMSD służy do oceny, jak dobrze system uczy się danego modelu.
W spektroskopii magnetycznego rezonansu jądrowego białek RMSD jest używany jako miara do oceny jakości otrzymanej wiązki struktur.
Zgłoszenia do nagrody Netflix zostały ocenione przy użyciu RMSD na podstawie nieujawnionych „prawdziwych” wartości zestawu danych testowych.
W symulacji zużycia energii w budynkach RMSE i CV(RMSE) są wykorzystywane do kalibracji modeli do pomiaru wydajności budynku.
W krystalografii rentgenowskiej , RMSD (i RMSZ) jest używany do pomiaru odchylenia wewnętrznych współrzędnych molekularnych odbiegających od wartości biblioteki ograniczeń.

Zobacz też

Bibliografia

^ Hyndman, Rob J.; Koehler, Anna B. (2006). „Inne spojrzenie na miary dokładności prognoz”. Międzynarodowy Dziennik Prognozowania . 22 (4): 679–688. CiteSeerX 10.1.1.154.9771 . doi : 10.1016/j.ijforecast.2006.03.001 .
^ ^B Poncki Robert; Thontteh, Olufunmilayo; Chen, Hao (2008). „Składniki informacji do porównania wielu rozdzielczości między mapami, które dzielą rzeczywistą zmienną”. Statystyka ekologiczna środowiska . 15 (2): 111–142. doi : 10.1007/s10651-007-0043-y .
^ Willmott, Cort; Matsuura, Kenji (2006). „W sprawie wykorzystania zwymiarowanych miar błędu do oceny wydajności interpolatorów przestrzennych”. International Journal of Geographical Information Science . 20 : 89–102. doi : 10.1080/13658810500286976 .
^ „Program Badawczy Wlotów Przybrzeżnych (CIRP) Wiki - Statystyka” . Pobrano 4 lutego 2015 .
^ „FAQ: Jaki jest współczynnik zmienności?” . Źródło 19 luty 2019 .
^ Armstrong, J. Scott; Collopy, Fred (1992). „Miary błędów do uogólniania metod prognozowania: porównania empiryczne” (PDF) . Międzynarodowy Dziennik Prognozowania . 8 (1): 69–80. CiteSeerX 10.1.1.423.508 . doi : 10.1016/0169-2070(92)90008-w .
^ Anderson, poseł; Woessner, WW (1992). Stosowane modelowanie wód gruntowych: symulacja przepływu i transportu adwekcyjnego (wyd. 2). Prasa akademicka.
^ Zbiorczy model sieci neuronowej
^ ANSI / BPI-2400-S-2012: Standardowa praktyka dla znormalizowanej kwalifikacji prognoz oszczędności energii w całym domu przez kalibrację do historii zużycia energii

[1] Hyndman, Rob J.; Koehler, Anna B. (2006). „Inne spojrzenie na miary dokładności prognoz”. Międzynarodowy Dziennik Prognozowania . 22 (4): 679–688. CiteSeerX 10.1.1.154.9771 . doi : 10.1016/j.ijforecast.2006.03.001 .

[:0-2] B Poncki Robert; Thontteh, Olufunmilayo; Chen, Hao (2008). „Składniki informacji do porównania wielu rozdzielczości między mapami, które dzielą rzeczywistą zmienną”. Statystyka ekologiczna środowiska . 15 (2): 111–142. doi : 10.1007/s10651-007-0043-y .

[3] Willmott, Cort; Matsuura, Kenji (2006). „W sprawie wykorzystania zwymiarowanych miar błędu do oceny wydajności interpolatorów przestrzennych”. International Journal of Geographical Information Science . 20 : 89–102. doi : 10.1080/13658810500286976 .

[4] „Program Badawczy Wlotów Przybrzeżnych (CIRP) Wiki - Statystyka” . Pobrano 4 lutego 2015 .

[5] „FAQ: Jaki jest współczynnik zmienności?” . Źródło 19 luty 2019 .

[6] Armstrong, J. Scott; Collopy, Fred (1992). „Miary błędów do uogólniania metod prognozowania: porównania empiryczne” (PDF) . Międzynarodowy Dziennik Prognozowania . 8 (1): 69–80. CiteSeerX 10.1.1.423.508 . doi : 10.1016/0169-2070(92)90008-w .

[7] Anderson, poseł; Woessner, WW (1992). Stosowane modelowanie wód gruntowych: symulacja przepływu i transportu adwekcyjnego (wyd. 2). Prasa akademicka.

[8] Zbiorczy model sieci neuronowej

[9] ANSI / BPI-2400-S-2012: Standardowa praktyka dla znormalizowanej kwalifikacji prognoz oszczędności energii w całym domu przez kalibrację do historii zużycia energii

Languages

In other projects