Odchylenie wartości średniokwadratowej - Root-mean-square deviation

Odchylenie korzeń średnią kwadratową ( RMSD ) lub korzeń średnią kwadratową błędów ( RMSE ) jest często stosowanym miernikiem różnic między wartościami (próbki lub wartości populacyjnych) przewidywane przez model lub estymatora a wartościami obserwowanymi. RMSD reprezentuje pierwiastek kwadratowy z drugiego momentu próbki różnic między wartościami przewidywanymi a wartościami obserwowanymi lub średnią kwadratową tych różnic. Te odchylenia są nazywane pozostałości gdy obliczenia wykonywane są na próbce danych, który został użyty do oszacowania i nazywane są błędy (lub błędów predykcji), gdy obliczony out-of-sample. RMSD służy do agregowania wielkości błędów w prognozach dla różnych punktów danych w jedną miarę mocy predykcyjnej. RMSD to miara dokładności służąca do porównywania błędów prognozowania różnych modeli dla konkretnego zestawu danych, a nie między zestawami danych, ponieważ jest zależna od skali.

RMSD jest zawsze nieujemna, a wartość 0 (prawie nigdy nie osiągnięta w praktyce) wskazywałaby na idealne dopasowanie do danych. Ogólnie rzecz biorąc, niższy RMSD jest lepszy niż wyższy. Jednak porównania różnych typów danych byłyby nieprawidłowe, ponieważ miara zależy od skali użytych liczb.

RMSD to pierwiastek kwadratowy ze średniej kwadratów błędów. Wpływ każdego błędu na RMSD jest proporcjonalny do wielkości kwadratu błędu; zatem większe błędy mają nieproporcjonalnie duży wpływ na RMSD. W związku z tym RMSD jest wrażliwy na wartości odstające.

Formuła

RMSD estymatora w odniesieniu do szacowanego parametru jest definiowana jako pierwiastek kwadratowy błędu średniokwadratowego :

W przypadku nieobciążonego estymatora RMSD jest pierwiastkiem kwadratowym wariancji, znanym jako odchylenie standardowe .

RMSD przewidywanych wartości dla czasu t od A regresji jest zmienną zależną ze zmiennymi obserwowane przez T czas, jest obliczana dla T różnych przewidywania jako pierwiastka kwadratowego średniej kwadratów odchyleń:

(W przypadku regresji na danych przekrojowych indeks dolny t jest zastępowany przez i , a T przez n .)

W niektórych dyscyplinach RMSD służy do porównywania różnic między dwiema rzeczami, które mogą się różnić, z których żadna nie jest akceptowana jako „standard”. Na przykład, mierząc średnią różnicę między dwoma szeregami czasowymi i , formuła staje się

Normalizacja

Normalizacja RMSD ułatwia porównanie zestawów danych lub modeli o różnych skalach. Chociaż w literaturze nie ma spójnych sposobów normalizacji, powszechnymi wyborami są średnia lub zakres (zdefiniowany jako wartość maksymalna minus wartość minimalna) zmierzonych danych:

lub .

Wartość ta jest powszechnie określana jako znormalizowane odchylenie średniokwadratowe lub błąd (NRMSD lub NRMSE) i często wyrażana w procentach, gdzie niższe wartości wskazują na mniejszą wariancję resztową. W wielu przypadkach, zwłaszcza w przypadku mniejszych próbek, na zakres próbki może mieć wpływ wielkość próbki, co utrudniałoby porównania.

Inną możliwą metodą uczynienia RMSD bardziej użyteczną miarą porównawczą jest podzielenie RMSD przez rozstęp międzykwartylowy . Podczas dzielenia RMSD przez IQR znormalizowana wartość staje się mniej wrażliwa na wartości ekstremalne w zmiennej docelowej.

gdzie

z i gdzie CDF -1 jest odwrotna dystrybuanta .

Normalizując przez średnią wartość pomiarów, można zastosować termin współczynnik zmienności RMSD, CV(RMSD), aby uniknąć niejednoznaczności. Jest to analogiczne do współczynnika zmienności, w którym RMSD zastępuje odchylenie standardowe .

Średni błąd bezwzględny

Niektórzy badacze zalecali stosowanie średniego błędu bezwzględnego (MAE) zamiast odchylenia średniokwadratowego. MAE ma przewagę w interpretacji nad RMSD. MAE jest średnią wartości bezwzględnych błędów. MAE jest zasadniczo łatwiejszy do zrozumienia niż pierwiastek kwadratowy ze średniej kwadratów błędów. Ponadto każdy błąd wpływa na MAE wprost proporcjonalnie do wartości bezwzględnej błędu, co nie ma miejsca w przypadku RMSD.

Aplikacje

Zobacz też

Bibliografia

  1. ^ Hyndman, Rob J.; Koehler, Anna B. (2006). „Inne spojrzenie na miary dokładności prognoz”. Międzynarodowy Dziennik Prognozowania . 22 (4): 679–688. CiteSeerX  10.1.1.154.9771 . doi : 10.1016/j.ijforecast.2006.03.001 .
  2. ^ B Poncki Robert; Thontteh, Olufunmilayo; Chen, Hao (2008). „Składniki informacji do porównania wielu rozdzielczości między mapami, które dzielą rzeczywistą zmienną”. Statystyka ekologiczna środowiska . 15 (2): 111–142. doi : 10.1007/s10651-007-0043-y .
  3. ^ Willmott, Cort; Matsuura, Kenji (2006). „W sprawie wykorzystania zwymiarowanych miar błędu do oceny wydajności interpolatorów przestrzennych”. International Journal of Geographical Information Science . 20 : 89–102. doi : 10.1080/13658810500286976 .
  4. ^ „Program Badawczy Wlotów Przybrzeżnych (CIRP) Wiki - Statystyka” . Pobrano 4 lutego 2015 .
  5. ^ „FAQ: Jaki jest współczynnik zmienności?” . Źródło 19 luty 2019 .
  6. ^ Armstrong, J. Scott; Collopy, Fred (1992). „Miary błędów do uogólniania metod prognozowania: porównania empiryczne” (PDF) . Międzynarodowy Dziennik Prognozowania . 8 (1): 69–80. CiteSeerX  10.1.1.423.508 . doi : 10.1016/0169-2070(92)90008-w .
  7. ^ Anderson, poseł; Woessner, WW (1992). Stosowane modelowanie wód gruntowych: symulacja przepływu i transportu adwekcyjnego (wyd. 2). Prasa akademicka.
  8. ^ Zbiorczy model sieci neuronowej
  9. ^ ANSI / BPI-2400-S-2012: Standardowa praktyka dla znormalizowanej kwalifikacji prognoz oszczędności energii w całym domu przez kalibrację do historii zużycia energii