Oczekiwana wartość doskonałej informacji - Expected value of perfect information

W teorii decyzji , oczekiwana wartość doskonałej informacji (EVPI) jest cena, że jeden byłby skłonny zapłacić, aby uzyskać dostęp do doskonałych informacji . Powszechną dyscypliną wykorzystującą koncepcję EVPI jest ekonomia zdrowia . W tym kontekście i przy podejmowaniu decyzji o przyjęciu nowej technologii leczenia zawsze istnieje pewien stopień niepewności związany z decyzją, ponieważ zawsze istnieje szansa, że ​​decyzja okaże się błędna. Wartość oczekiwana doskonałej analizy informacji próbuje zmierzyć oczekiwany koszt tej niepewności, który „można zinterpretować jako wartość oczekiwaną doskonałej informacji (EVPI), ponieważ doskonała informacja może wyeliminować możliwość podjęcia błędnej decyzji” przynajmniej od Teoretyczna perspektywa.

Równanie

Problem jest modelowany za pomocą macierzy wypłat R ij, w której indeks wiersza i opisuje wybór, którego musi dokonać gracz, a indeks kolumny j opisuje zmienną losową, o której gracz jeszcze nie wie, a która ma prawdopodobieństwo p j bycia w stanie j . Jeśli gracz ma wybrać i nie znając wartości j , najlepszym wyborem jest ten, który maksymalizuje oczekiwaną wartość pieniężną :

gdzie

jest oczekiwaną wypłatą za działanie i tj. wartością oczekiwaną , a

wybiera maksimum tych oczekiwań dla wszystkich dostępnych działań. Z drugiej strony, mając doskonałą znajomość j , gracz może wybrać wartość i, która optymalizuje oczekiwanie dla tego konkretnego j . Dlatego oczekiwana wartość przy doskonałej informacji to

gdzie jest prawdopodobieństwem, że system jest w stanie j , i jest wypłatą, jeśli wykona się akcję i, gdy system jest w stanie j . Tutaj wskazuje najlepszy wybór akcji i dla każdego stanu j .

Oczekiwana wartość doskonałej informacji to różnica między tymi dwiema wielkościami,

Różnica ta opisuje, w oczekiwaniu, jak dużo większa wartość gracz może liczyć na uzyskanie znając j i wybranie najlepszych i do tego j , w porównaniu do podnoszenia wartości I przed j jest znana. Ponieważ EV|PI jest z konieczności większe lub równe EMV, EVPI jest zawsze nieujemne.

EVPI dostarcza kryterium, według którego można oceniać zwykłych, niedoskonale poinformowanych prognostów. EVPI można wykorzystać do odrzucenia kosztownych propozycji: jeśli ktoś oferuje wiedzę za cenę wyższą niż EVPI, lepiej odrzucić ofertę. Jest jednak mniej pomocna przy podejmowaniu decyzji o przyjęciu oferty prognostycznej, ponieważ trzeba znać jakość zdobywanych informacji.

Przykład

Ustawiać:

Załóżmy, że zamierzasz zainwestować tylko w jeden z trzech instrumentów inwestycyjnych: akcje, fundusz powierniczy lub certyfikat depozytowy (CD). Załóżmy dalej, że rynek ma 50% szans na wzrost, 30% na utrzymanie się parzystości i 20% na spadek. Jeśli rynek wzrośnie, inwestycja w akcje zarobi 1500 USD, a fundusz powierniczy zarobi 900 USD. Jeśli rynek się utrzyma, nawet inwestycja w akcje zarobi 300 USD, a fundusz powierniczy zarobi 600 USD. Jeśli rynek spadnie, inwestycje w akcje stracą 800 USD, a fundusz powierniczy straci 200 USD. Certyfikat depozytowy zarobi 500 USD niezależnie od wahań na rynku.

Pytanie:

Jaka jest oczekiwana wartość doskonałej informacji?

Rozwiązanie:

Tutaj macierz wypłat to:

Wektor prawdopodobieństwa to:

Oczekiwania dla każdego pojazdu ( ):

Maksimum tych oczekiwań to pojazd fabryczny. Nie wiedząc, w jakim kierunku pójdzie rynek (znając tylko prawdopodobieństwo kierunków), spodziewamy się, że zarobimy najwięcej pieniędzy za pomocą pojazdu giełdowego.

Zatem,

Z drugiej strony zastanów się, czy wiedzieliśmy z wyprzedzeniem, w którą stronę zmieni się rynek. Biorąc pod uwagę znajomość kierunku rynku, podjęlibyśmy (potencjalnie) inną decyzję dotyczącą wehikułu inwestycyjnego.

Oczekiwanie na maksymalizację zysku ze względu na stan rynku:

Oznacza to, że biorąc pod uwagę każdy kierunek rynku, wybieramy narzędzie inwestycyjne, które maksymalizuje zysk.

Stąd,

Wniosek:

Znajomość kierunku, w którym pójdzie rynek (tj. posiadanie doskonałych informacji), jest warte 350 dolarów.

Dyskusja:

Jeśli ktoś sprzedawał informacje, które gwarantowały dokładne przewidywanie przyszłego kierunku rynku, chcielibyśmy kupić te informacje tylko wtedy, gdy cena była niższa niż 350 USD. Gdyby cena była wyższa niż 350 USD, nie kupowalibyśmy informacji, jeśli cena byłaby niższa niż 350 USD, kupowalibyśmy informacje. Jeśli cena wynosiła dokładnie 350 dolarów, to nasza decyzja jest daremna.

Załóżmy, że cena informacji wynosiła 349,99 USD i ją kupiliśmy. Wtedy spodziewalibyśmy się, że zarobimy 1030 - 349,99 = 680,01 > 680. Dlatego kupując informacje byliśmy w stanie zarobić o 0,01 USD więcej niż gdybyśmy nie kupowali informacji.

Załóżmy, że cena informacji wynosiła 350,01 USD i ją kupiliśmy. Wtedy spodziewalibyśmy się, że zarobimy 1030 - 350,01 = 679,99 < 680. Dlatego kupując informacje straciliśmy 0,01 USD w porównaniu z brakiem zakupu informacji.

Załóżmy, że cena informacji wynosiła 350,00 USD i ją kupiliśmy. Wtedy spodziewalibyśmy się, że zarobimy 1030 - 350,00 = 680,00 = 680. Dlatego kupując informacje nie zyskaliśmy ani nie straciliśmy żadnych pieniędzy decydując się na zakup tych informacji w porównaniu z niekupowaniem informacji.

Uwaga: Jako praktyczny przykład, używanie pieniędzy do zakupu przedmiotów wiąże się z pewnym kosztem (wartość pieniądza w czasie), który również należy wziąć pod uwagę.

Zobacz też

Bibliografia