Model predykcyjny przedziału - Interval predictor model

W analizie regresji An przedział modelu predykcyjnym ( IPM ) to metoda regresji, w których granice na funkcję należy zbliżyć do związku. Różni się to od innych technik w uczeniu maszynowym , gdzie zwykle chce się oszacować wartości punktowe lub cały rozkład prawdopodobieństwa. Modele predyktorów interwałowych są czasami określane jako nieparametryczna technika regresji , ponieważ moduł IPM zawiera potencjalnie nieskończony zestaw funkcji, a dla zmiennych poddanych regresji nie zakłada się żadnego konkretnego rozkładu. W konsekwencji teorii optymalizacji scenariuszy , w wielu przypadkach można poczynić rygorystyczne prognozy dotyczące wydajności modelu w czasie testu. Stąd model predykcyjny przedziału może być postrzegany jako gwarantowane ograniczenie regresji kwantylowej . Modele predyktorów interwałowych można również postrzegać jako sposób na określenie obsługi modeli predyktorów losowych, których szczególnym przypadkiem jest proces Gaussa .

Modele predyktorów wypukłych przedziałów

Zazwyczaj model predykcyjny przedziału jest tworzony przez określenie funkcji parametrycznej, która jest zwykle wybierana jako iloczyn wektora parametrów i podstawy. Zwykle podstawa składa się z cech wielomianowych lub czasami stosuje się podstawę promieniową. Następnie zestaw wypukły jest przypisywany do wektora parametrów, a rozmiar zestawu wypukłego jest minimalizowany tak, że każdy możliwy punkt danych może być przewidziany przez jedną możliwą wartość parametrów. Zestawy parametrów elipsoidalnych zostały wykorzystane przez Campi (2009), które dają wypukły program optymalizacyjny do trenowania IPM. Crespo (2016) zaproponował zastosowanie hiperprostokątnego zestawu parametrów, co skutkuje wygodną, ​​liniową formą granic IPM. Dlatego IPM można wytrenować za pomocą programu optymalizacji liniowej:

gdzie przykładami danych uczących są i , a Interval Predictor Model ogranicza i są sparametryzowane przez wektor parametrów . Wiarygodność takiego modułu IPM uzyskuje się poprzez odnotowanie, że dla wypukłego modułu modułu IPM liczba ograniczeń wsparcia jest mniejsza niż wymiarowość parametrów możliwych do trenowania , a zatem można zastosować podejście scenariuszowe.

Lacerda (2017) wykazała, że ​​podejście to można rozszerzyć na sytuacje, w których dane treningowe mają wartość interwałową, a nie punktową.

Niewypukłe modele predyktorów przedziałowych

W Campi (2015) zaproponowano niewypukłą teorię optymalizacji scenariuszy. Wiąże się to z pomiarem liczby ograniczeń podparcia dla modelu predyktora przedziału po uczeniu, a tym samym wykonaniem prognoz dotyczących wiarygodności modelu. Umożliwia to tworzenie niewypukłych modułów IPM, takich jak jednowarstwowa sieć neuronowa. Campi (2015) pokazuje, że algorytm, w którym program optymalizacji scenariusza jest rozwiązywany tylko w czasach, które mogą określić wiarygodność modelu w czasie testu bez uprzedniej oceny na zbiorze walidacyjnym. Osiąga się to poprzez rozwiązanie programu optymalizacyjnego

gdzie linia środkowa modelu predyktora przedziału , a szerokość modelu . Powoduje to IPM, który dokonuje prognoz z niepewnością homoskedastyczną.

Sadeghi (2019) pokazuje, że podejście oparte na scenariuszach niewypukłych z Campi (2015) można rozszerzyć, aby trenować głębsze sieci neuronowe, które przewidują interwały z niepewnością heteroskedastyczną w zestawach danych z nieprecyzyjnością. Osiąga się to poprzez zaproponowanie uogólnień do funkcji straty maksymalnego błędu podanej przez

co jest równoznaczne z rozwiązaniem programu optymalizacyjnego zaproponowanego przez Campi (2015).

Aplikacje

Początkowo optymalizację scenariuszy zastosowano do solidnych problemów sterowania.

Crespo (2015) zastosował Interval Predictor Models do projektowania ekranowania promieniowania kosmicznego.

W Patelli (2017), Faes (2019) i Crespo (2018) do problemu analizy niezawodności konstrukcji zastosowano modele Interval Predictor . Brandt (2017) stosuje interwałowe modele prognostyczne do szacowania uszkodzeń zmęczeniowych podkonstrukcji płaszczowych morskich turbin wiatrowych.

Garatti (2019) wykazał, że warstwy Czebyszewa (tj. warstwy minimaksowe wokół funkcji dopasowanych regresją liniową ) należą do szczególnej klasy modeli predyktorów interwałowych, dla których wiarygodność jest niezmienna w odniesieniu do rozkładu danych.


Wdrożenia oprogramowania

PyIPM zapewnia implementację open-source Pythona pracy Crespo (2015). OpenCOSSAN zapewnia implementację Matlab prac Crespo (2015).

Bibliografia