Wariogram - Variogram

W statystyce przestrzennej wariogram teoretyczny jest funkcją opisującą stopień przestrzennej zależności przestrzennego pola losowego lub procesu stochastycznego . Semivariogram to połowa wariogramów.

W przypadku konkretnego przykładu z dziedziny wydobycia złota , wariogram będzie miarą tego, jak bardzo dwie próbki pobrane z obszaru wydobycia będą się różnić procentem złota w zależności od odległości między tymi próbkami. Próbki pobrane daleko od siebie będą się różnić bardziej niż próbki pobrane blisko siebie.

Definicja

Semivariogram najpierw określa Matheron (1963), a pół średniego kwadratu różnicy pomiędzy wartościami w punktach ( i ), oddzielone na odległość . Formalnie

gdzie jest punktem w polu geometrycznym i jest wartością w tym punkcie. Całka potrójna ma ponad 3 wymiary. to odległość separacji (np. w metrach lub km) zainteresowania. Na przykład wartość może reprezentować zawartość żelaza w glebie w pewnym miejscu (ze współrzędnymi geograficznymi szerokości, długości i wysokości) w pewnym regionie z elementem objętości . Aby uzyskać semiwariogram dla danego , próbkowane byłyby wszystkie pary punktów w tej dokładnej odległości. W praktyce niemożliwe jest pobieranie próbek wszędzie, dlatego zamiast tego stosuje się wariogram empiryczny .

Wariogram jest dwukrotnością semiwariogramu i może być zdefiniowany, równoważnie, jako wariancja różnicy między wartościami pól w dwóch lokalizacjach ( i , zauważ zmianę notacji z to i na ) w różnych realizacjach pola (Cressie 1993):

Jeśli przestrzenne pole losowe ma stałą średnią , jest to równoważne oczekiwaniu dla kwadratu przyrostu wartości między lokalizacjami i (Wackernagel 2003) (gdzie i są punktami w przestrzeni i ewentualnie w czasie):

W przypadku procesu stacjonarnego wariogram i semiwariogram mogą być reprezentowane jako funkcja różnicy między lokalizacjami jedynie za pomocą następującej zależności (Cressie 1993):

Jeżeli proces jest ponadto izotropowy , to wariogram i semiwariogram mogą być reprezentowane jedynie przez funkcję odległości (Cressie 1993):

Indeksy lub zazwyczaj nie są napisane. Terminy są używane dla wszystkich trzech form funkcji. Co więcej, termin „wariogram” jest czasami używany do oznaczenia semiwariogramu, a symbol jest czasami używany dla wariogramu, co wprowadza pewne zamieszanie.

Nieruchomości

Według (Cressie 1993, Chiles i Delfiner 1999, Wackernagel 2003) wariogram teoretyczny ma następujące właściwości:

  • Semiwariogram jest nieujemny , ponieważ jest oczekiwaniem kwadratu.
  • Semiwariogram w odległości 0 to zawsze 0, ponieważ .
  • Funkcja jest semiwariogramem wtedy i tylko wtedy, gdy jest funkcją warunkowo ujemną określoną, tj. dla wszystkich wag podlegających i lokalizacji, które posiada:
co odpowiada fakt, że odchylenie od określał negatyw tej podwójnej sumy i nie może być ujemna.
  • Jeśli istnieje funkcja kowariancji procesu stacjonarnego, jest ona powiązana z wariogramem przez

  • Jeśli stacjonarne pole losowe nie ma zależności przestrzennej (tj. if ), semiwariogram jest stałą wszędzie z wyjątkiem początku, gdzie wynosi zero.
  • jest funkcją symetryczną.
  • W związku z tym jest funkcją parzystą .
  • Jeśli pole losowe jest stacjonarne i ergodyczne , odpowiada wariancji tego pola. Granica semiwariogramu nazywana jest również jego progiem .
  • W konsekwencji semiwariogram może być nieciągły tylko na początku. Wysokość skoku w punkcie początkowym jest czasami określana jako samorodek lub efekt samorodka.

Parametry

Podsumowując, do opisu wariogramów często stosuje się następujące parametry:

  • nugget : wysokość skoku semiwariogramu w nieciągłości w punkcie początkowym.
  • próg : granica wariogramu mająca tendencję do nieskończoności odległości opóźnienia.
  • range : Odległość, w której różnica wariogramu od progu staje się nieistotna. W modelach ze stałym progiem jest to odległość, przy której zostaje on osiągnięty po raz pierwszy; w przypadku modeli z progiem asymptotycznym konwencjonalnie przyjmuje się odległość, w której semiwariancja po raz pierwszy osiąga 95% progu.

Wariogram empiryczny

Ogólnie rzecz biorąc, wariogram empiryczny jest potrzebny dla danych pomiarowych, ponieważ informacje o próbce nie są dostępne dla każdej lokalizacji. Informacją o próbce może być na przykład stężenie żelaza w próbkach gleby lub intensywność pikseli w aparacie. Każda informacja o próbce ma współrzędne dla przestrzeni próbki 2D, gdzie i są współrzędnymi geograficznymi. W przypadku żelaza w glebie przestrzeń próbki może być trójwymiarowa. Jeśli istnieje również zmienność czasowa (np. zawartość fosforu w jeziorze), może to być wektor czterowymiarowy . W przypadku, gdy wymiary mają różne jednostki (np. odległość i czas), do każdego można zastosować współczynnik skalowania, aby uzyskać zmodyfikowaną odległość euklidesową.

Przykładowe obserwacje są oznaczone . Próbki można pobierać w różnych lokalizacjach. Zapewniłoby to zestaw próbek w lokalizacjach . Ogólnie rzecz biorąc, wykresy przedstawiają wartości semiwariogramu jako funkcję rozdziału punktów próbkowania . W przypadku semiwariogramu empirycznego, zamiast dokładnych odległości stosuje się kosze odległości separacji i zwykle zakłada się warunki izotropowe (tj. jest to tylko funkcja i nie zależy od innych zmiennych, takich jak położenie środka). Następnie można obliczyć semiwariogram empiryczny dla każdego bin:

Innymi słowy, znaleziono każdą parę punktów oddzielonych (plus lub minus pewien zakres tolerancji szerokości przedziału ). Stanowią one zbiór punktów . Liczba tych punktów w tym koszu to . Następnie dla każdej pary punktów znajduje się kwadrat różnicy obserwacji (np. zawartość próbki gleby lub intensywność pikseli) ( ). Te kwadraty różnic są sumowane i normalizowane przez liczbę naturalną . Z definicji wynik jest dzielony przez 2 dla semiwariogramu w tym rozdziale.

Do szybkości obliczeniowej potrzebne są tylko unikalne pary punktów. Na przykład dla 2 obserwacji należy uwzględnić tylko pary [ ] z lokalizacji z separacją [ ], ponieważ pary [ ] nie dostarczają żadnych dodatkowych informacji.

Modele wariogramów

Wariogramu empirycznego nie można obliczyć dla każdej odległości opóźnienia, a ze względu na zmienność oszacowania nie ma pewności, że jest to prawidłowy wariogram, jak zdefiniowano powyżej. Jednak niektóre metody geostatystyczne , takie jak kriging, wymagają prawidłowych semiwariogramów. W geostatystyce stosowanej wariogramy empiryczne są więc często aproksymowane funkcją modelu zapewniającą trafność (Chiles i Delfiner 1999). Niektóre ważne modele to (Chiles i Delfiner 1999, Cressie 1993):

  • Wykładniczy model wariogramu
  • Sferyczny model wariogramu
  • Model wariogramu Gaussa

Parametr ma różne wartości w różnych odniesieniach, ze względu na niejednoznaczność definicji zakresu. Np. jest wartością używaną w (Chiles&Definer 1999). Funkcji wynosi 1, gdy a 0 w pozostałych przypadkach.

Dyskusja

W geostatystyce stosuje się trzy funkcje do opisu przestrzennej lub czasowej korelacji obserwacji: są to korelogram , kowariancja i semiwariogram . Ten ostatni jest również prościej nazywany wariogramem . Wariogramów próbek , w przeciwieństwie do semivariogram i wariogramów, pokazuje, w którym stopień zależności przestrzennej powierzchni próbki i próbek rozprasza urządzenie do przypadkowości gdy warunki wariancji czasowo lub in situ uporządkowanym wykreślono wariancji zestawu oraz dolne granice jego 99% i 95% zakresów ufności.

Wariogram jest kluczową funkcją w geostatystyce, ponieważ zostanie wykorzystany do dopasowania modelu czasowej/ przestrzennej korelacji obserwowanego zjawiska. W ten sposób dokonuje się rozróżnienia między wariogramem eksperymentalnym, który jest wizualizacją możliwej korelacji przestrzennej/czasowej, a modelem wariogramu, który jest dalej używany do definiowania wag funkcji krigingu . Należy zauważyć, że wariogramów doświadczalne empiryczny oszacowanie kowariancji z procesu Gaussa . Jako taki, może nie być określony dodatnio, a zatem nie może być bezpośrednio wykorzystany w krigingu , bez ograniczeń lub dalszego przetwarzania. To wyjaśnia, dlaczego wykorzystywana jest tylko ograniczona liczba modeli wariogramów: najczęściej modele liniowe, sferyczne, gaussowskie i wykładnicze.

Aplikacje

Empiryczny wariogramów stosuje się geostatystyki jako pierwsze oszacowanie modelu wariogramów potrzebnej do interpolacji przestrzennego w kriging .

  • Do określenia kryteriów koincydencji dla pomiarów satelitarnych i naziemnych wykorzystano wariogramy empiryczne zmienności czasoprzestrzennej uśrednionego kolumnowo dwutlenku węgla .
  • Wariogramy empiryczne obliczono dla gęstości materiału niejednorodnego (Gilsocarbon).
  • Empiryczne semiwariogram są obliczane na podstawie obserwacji silnego ruchu ziemi od trzęsienia ziemi . Modele te są wykorzystywane do oceny ryzyka sejsmicznego i strat infrastruktury rozproszonej przestrzennie.

Pojęcia pokrewne

Kwadrat określenie w wariogramów, na przykład mogą być zastąpione różnymi uprawnieniami: a madogram , definiuje się jako bezwzględną różnicę , i rodogram określa się z pierwiastka bezwzględnej różnicy . Mówi się, że estymatory oparte na tych niższych potęgach są bardziej odporne na wartości odstające . Można je uogólnić jako „wariogram rzędu α ”,

,

gdzie wariogram jest rzędu 2, madogram jest wariogramem rzędu 1, a rodogram jest wariogramem rzędu 0,5.

Kiedy wariogram jest używany do opisania korelacji różnych zmiennych, nazywa się go wariogramem krzyżowym . W co-krigingu stosuje się wariogramy krzyżowe . Jeżeli zmienna jest binarna lub reprezentuje klasy wartości, mówi się wtedy o wariogramach wskaźnikowych . Wariogram wskaźnikowy jest używany w krigingu wskaźnikowym .

Bibliografia

Dalsza lektura

  • Cressie, N., 1993, Statystyka danych przestrzennych, Wiley Interscience.
  • Chiles, JP, P. Delfiner, 1999, Geostatystyka, modelowanie niepewności przestrzennej, Wiley-Interscience.
  • Wackernagel, H., 2003, Geostatystyka wielowymiarowa, Springer.
  • Burrough, PA i McDonnell, RA, 1998, Zasady systemów informacji geograficznej.
  • Isobel Clark, 1979, Practical Geostatistics, Applied Science Publishers .
  • Clark, I., 1979, Practical Geostatistics , Applied Science Publishers.
  • David, M., 1978, Geostatystyczne szacowanie zasobów rudy , Wydawnictwo Elsevier.
  • Hald, A., 1952, Statistical Theory with Engineering Applications , John Wiley & Sons, New York.
  • Journel, AG i Huijbregts, Ch. J., 1978 Geostatystyka Górnicza , Wydawnictwo Akademickie.

Zewnętrzne linki