Sekwencja o małej rozbieżności - Low-discrepancy sequence
W matematyce ciąg o małej rozbieżności jest ciągiem o własności, że dla wszystkich wartości N , jego podciąg x 1 , ..., x N ma małą rozbieżność .
Z grubsza rzecz biorąc, rozbieżność sekwencji jest niska, jeśli proporcja punktów w sekwencji należących do dowolnego zbioru B jest blisko proporcjonalna do środka z B , jak stałoby się przeciętnie (ale nie dla poszczególnych próbek) w przypadku equidistributed sekwencji . Konkretne definicje rozbieżności różnią się w odniesieniu do wyboru B ( hipersfery , hipersześciany itp.) oraz sposobu obliczania rozbieżności dla każdego B (zwykle znormalizowanego) i łączenia (zwykle poprzez przyjęcie najgorszej wartości).
Ciągi o małej rozbieżności nazywane są również ciągami quasilosowymi , ze względu na ich powszechne zastosowanie jako zamiennik liczb losowych o rozkładzie jednostajnym . Modyfikator „quasi” służy do wyraźniejszego zaznaczenia, że wartości ciągu o małej rozbieżności nie są ani losowe, ani pseudolosowe , ale takie ciągi mają pewne właściwości zmiennych losowych i w niektórych zastosowaniach, takich jak metoda quasi-Monte Carlo, mają mniejszą rozbieżność to ważna zaleta.
Aplikacje
Liczby quasilosowe mają przewagę nad czystymi liczbami losowymi, ponieważ szybko i równomiernie pokrywają interesującą dziedzinę. Mają przewagę nad czysto deterministycznymi metodami, ponieważ metody deterministyczne zapewniają wysoką dokładność tylko wtedy, gdy liczba punktów danych jest wstępnie ustawiona, podczas gdy przy użyciu sekwencji quasi-losowych dokładność zwykle poprawia się w sposób ciągły, gdy dodawanych jest więcej punktów danych, z pełnym ponownym wykorzystaniem istniejących punktów. Z drugiej strony zbiory punktów quasi-losowych mogą mieć znacznie mniejszą rozbieżność dla danej liczby punktów niż ciągi czysto losowe.
Przydatnym zastosowania to znalezienia funkcji charakterystycznej o funkcji gęstości prawdopodobieństwa , i znalezienie pochodnej funkcji deterministycznej funkcji z niewielką ilością szumów. Liczby quasilosowe umożliwiają bardzo szybkie obliczenie momentów wyższego rzędu z dużą dokładnością.
Zastosowania, które nie wymagają sortowania, to znajdowanie średniej , odchylenia standardowego , skośności i kurtozy rozkładu statystycznego oraz znajdowanie całkowitych i globalnych maksimów i minimów trudnych funkcji deterministycznych. Liczby quasilosowe mogą być również używane do dostarczania punktów początkowych dla algorytmów deterministycznych, które działają tylko lokalnie, takich jak iteracja Newtona-Raphsona .
Liczby quasilosowe można również łączyć z algorytmami wyszukiwania. Algorytm w stylu Quicksort drzewa binarnego powinien działać wyjątkowo dobrze, ponieważ liczby quasilosowe spłaszczają drzewo znacznie lepiej niż liczby losowe, a im bardziej płaskie drzewo, tym szybsze sortowanie. Z algorytmu wyszukiwania, numery quasirandom mogą być wykorzystywane w celu znalezienia tryb , mediana , przedziały ufności i skumulowany rozkład z rozkładem statystycznym, a wszystkie lokalne minima i wszystkie rozwiązania funkcji deterministycznych.
Ciągi o małej rozbieżności w całkowaniu numerycznym
Co najmniej trzy metody całkowania numerycznego można sformułować w następujący sposób. Mając zbiór { x 1 , ..., x N } w przedziale [0,1], aproksymuj całkę funkcji f jako średnią z funkcji obliczonej w tych punktach:
Jeśli punkty są wybrane jako x i = i / N , jest to reguła prostokąta . Jeśli punkty są wybierane do losowego (lub pseudolosowego ) rozdzielenia, jest to metoda Monte Carlo . Jeżeli punkty są wybrane jako elementy ciągu o małej rozbieżności, jest to metoda quasi-Monte Carlo . Godny uwagi wynik, nierówność Koksmy-Hlawki (podana poniżej), pokazuje, że błąd takiej metody może być ograniczony iloczynem dwóch wyrazów, z których jeden zależy tylko od f , a drugi to rozbieżność zbioru { x 1 , ..., x N }.
Jest wygodne, aby skonstruować zestaw { x 1 , ..., x N }, w taki sposób, że jeśli zbiór z N +1 elementów jest zbudowana, poprzednie N elementy nie muszą być ponownie obliczonych. Reguła prostokąta wykorzystuje zestaw punktów, które mają małą rozbieżność, ale ogólnie elementy muszą być przeliczone, jeśli N jest zwiększone. Elementy nie muszą być przeliczane w losowej metodzie Monte Carlo, jeśli N jest zwiększone, ale zbiory punktów nie mają minimalnej rozbieżności. Używając sekwencji o małej rozbieżności, dążymy do małej rozbieżności i nie ma potrzeby ponownego obliczania, ale w rzeczywistości sekwencje o małej rozbieżności mogą być przyrostowo dobre tylko w przypadku rozbieżności, jeśli nie pozwolimy na ponowne przeliczenie.
Definicja rozbieżności
Rozbieżność o zadanej P = { x 1 , ..., x N } zdefiniowano za pomocą Niederreiter w notacji jako
gdzie λ s jest s- wymiarową miarą Lebesgue'a , A ( B ; P ) jest liczbą punktów w P , które wpadają w B , a J jest zbiorem s- wymiarowych przedziałów lub pudełek postaci
gdzie .
Gwiazdy rozbieżność D * N ( P ) jest określony w podobny sposób, z tym że Supremum przejmuje zestaw J * pudeł prostokątnych formie
gdzie u i jest w przedziale półotwartym [0, 1).
Oba są powiązane przez
Uwaga: W przypadku tych definicji rozbieżność reprezentuje najgorszy przypadek lub maksymalne odchylenie gęstości punktów jednolitego zestawu. Istotne są jednak również inne miary błędów, co prowadzi do innych definicji i miar zmienności. Na przykład, rozbieżność L2 lub zmodyfikowana wyśrodkowana rozbieżność L2 są również intensywnie wykorzystywane do porównywania jakości jednolitych zbiorów punktów. Oba są znacznie łatwiejsze do obliczenia dla dużych N i s.
Nierówność Koksmy–Hławki
Niech Ī s będzie s- wymiarowym sześcianem jednostkowym, Ī s = [0, 1] × ... × [0, 1]. Niech f ma ograniczoną wariację V ( f ) na Ī s w sensie Hardy'ego i Krausego. Wtedy dla dowolnego x 1 , ..., x N w I s = [0, 1) × ... × [0, 1),
Koksma - Hlawka nierówność jest ostry w następującym sensie: Dla każdego zestawu punktów { x 1 , ..., x N } w I a i każda znajduje się funkcja f o ograniczonej zmienności i V, ( f ) = 1, tak że
Dlatego jakość liczbowej reguły całkowania zależy tylko od rozbieżności D * N ( x 1 ,..., x N ).
Formuła Hławki-Zaremby
Niech . Bo piszemy
i oznaczać przez punkt otrzymany z x przez zastąpienie współrzędnych nie w u przez . Następnie
gdzie jest funkcja rozbieżności.
Wersja nierówności Koksma-Hlawka
Stosując nierówność Cauchy'ego-Schwarza dla całek i sum do tożsamości Hławki-Zaremby otrzymujemy wersję nierówności Koksmy-Hlawki:
gdzie
i
Rozbieżność L2 ma duże znaczenie praktyczne, ponieważ dla danego zbioru punktów możliwe są szybkie obliczenia jawne. W ten sposób łatwo jest tworzyć optymalizatory zestawu punktów, używając jako kryterium rozbieżności L2.
Nierówność Erdősa–Turana–Koksmy
Obliczeniowo trudno jest znaleźć dokładną wartość rozbieżności dużych zbiorów punktów. Erdős - Turan - Koksma nierówność stanowi górną granicę.
Niech x 1 ,..., x N będą punktami w I s a H będzie dowolną dodatnią liczbą całkowitą. Następnie
gdzie
Główne przypuszczenia
Hipoteza 1. Istnieje stała c s zależna tylko od wymiaru s , taka, że
dla dowolnego zbioru punktów skończonych { x 1 ,..., x N }.
Hipoteza 2. Istnieje stała c ' s zależna tylko od s , taka, że
dla nieskończonej liczby N dla dowolnej nieskończonej sekwencji x 1 , x 2 , x 3 ,....
Te przypuszczenia są równoważne. Zostały one udowodnione dla s ≤ 2 przez WM Schmidta . W wyższych wymiarach odpowiedni problem jest wciąż otwarty. Najbardziej znane dolne granice należą do Michaela Laceya i współpracowników.
Dolne granice
Niech s = 1. Wtedy
dla dowolnego zbioru punktów skończonych { x 1 , ..., x N }.
Niech s = 2. WM Schmidt udowodnił, że dla dowolnego zbioru punktów skończonych { x 1 , ..., x N },
gdzie
Dla dowolnych wymiarów s > 1 KF Roth udowodnił, że
dla dowolnego zbioru punktów skończonych { x 1 , ..., x N }. Józef Beck ustalił dwukrotną poprawę tego wyniku w trzech wymiarach. Zostało to ulepszone przez D. Bilyka i MT Lacey do potęgi pojedynczego logarytmu. Najbardziej znanym wiązaniem dla s > 2 są D. Bilyk i MT Lacey oraz A. Vagharshakyan. Dla s > 2 istnieje t > 0, więc
dla dowolnego zbioru punktów skończonych { x 1 , ..., x N }.
Konstruowanie ciągów o małej rozbieżności
Ponieważ dowolny rozkład liczb losowych może być odwzorowany na rozkład jednostajny, a liczby quasi-losowe są odwzorowane w ten sam sposób, ten artykuł dotyczy tylko generowania liczb quasi-losowych na wielowymiarowym rozkładzie jednostajnym.
Znane są konstrukcje sekwencji, takie, że
gdzie C jest pewną stałą, w zależności od sekwencji. Po hipotezie 2 uważa się, że sekwencje te mają najlepszą możliwą kolejność zbieżności. Poniższe przykłady są van der sekwencji Corput , w sekwencji Halton , oraz sekwencji Sobol . Jednym z ogólnych ograniczeń jest to, że metody konstrukcyjne mogą zwykle gwarantować tylko porządek zbieżności. Praktycznie małą rozbieżność można osiągnąć tylko wtedy, gdy N jest wystarczająco duże, a dla dużych danych s to minimalne N może być bardzo duże. Oznacza to, że przeprowadzenie analizy Monte-Carlo z np. s=20 zmiennymi i N=1000 punktów z generatora sekwencji o małej rozbieżności może zapewnić tylko bardzo niewielką poprawę dokładności.
Losowe liczby
Sekwencje liczb quasilosowych można generować z liczb losowych, nakładając ujemną korelację na te liczby losowe. Jednym ze sposobów, aby to zrobić, aby rozpocząć z zestawem liczb losowych na i cyfr konstrukt quasirandom które są jednorodne na podstawie:
dla nieparzystych i do wieczora.
Drugim sposobem na zrobienie tego z początkowymi liczbami losowymi jest skonstruowanie błądzenia losowego z przesunięciem 0.5, jak w:
Oznacza to, że weź poprzednią liczbę quasilosową, dodaj 0,5 i liczbę losową i weź wynik modulo 1.
W przypadku więcej niż jednego wymiaru można użyć kwadratów łacińskich o odpowiednim wymiarze, aby zapewnić przesunięcia, aby zapewnić równomierne pokrycie całej domeny.
Nawrót addytywny
Dla każdego irracjonalnego sekwencja
ma rozbieżności zmierzające do . Zauważ, że sekwencja może być zdefiniowana rekurencyjnie przez
Dobra wartość daje mniejszą rozbieżność niż ciąg niezależnych jednolitych liczb losowych.
Rozbieżność może być ograniczony przez wykładnik aproksymacji z . Jeśli wykładnikiem aproksymacji jest , to dla any , obowiązuje następujące ograniczenie:
Według twierdzenia Thue-Siegla-Rotha wykładnik aproksymacji dowolnej niewymiernej liczby algebraicznej wynosi 2, co daje granicę powyżej.
Powyższa relacja rekurencyjna jest podobna do relacji rekurencyjnej używanej przez liniowy generator kongruencji , niskiej jakości generator liczb pseudolosowych:
Dla powyższej, addytywnej powtarzalności o niskiej rozbieżności, aim są wybierane jako 1. Należy jednak pamiętać, że nie spowoduje to wygenerowania niezależnych liczb losowych, więc nie powinno być używane do celów wymagających niezależności.
Wartość z najmniejszą rozbieżnością to
Inną wartością, która jest prawie tak dobra, jest:
W więcej niż jednym wymiarze dla każdego wymiaru potrzebne są oddzielne liczby quasi-losowe. Wygodny zestaw wartości, które są używane, to pierwiastki kwadratowe liczb pierwszych od dwóch w górę, wszystkie wzięte modulo 1:
Wykazano jednak, że zestaw wartości opartych na uogólnionym złotym podziale daje bardziej równomiernie rozłożone punkty.
Lista generator liczb pseudolosowych metod list do generowania liczb pseudolosowych niezależnych. Uwaga: W kilku wymiarach rekurencyjna rekurencja prowadzi do jednolitych zbiorów dobrej jakości, ale dla większych s (takich jak s>8) inne generatory zbiorów punktów mogą oferować znacznie mniejsze rozbieżności.
Sekwencja van der Corputa
Pozwolić
będzie b- arną reprezentacją dodatniej liczby całkowitej n ≥ 1, tj. 0 ≤ d k ( n ) < b . Zestaw
Wtedy istnieje stała C zależna tylko od b taka, że ( g b ( n )) n ≥ 1 spełnia
gdzie D * N jest rozbieżnością gwiazdy .
Sekwencja Haltona
Sekwencja Haltona jest naturalnym uogólnieniem sekwencji van der Corputa do wyższych wymiarów. Niech s będzie dowolnym wymiarem, a b 1 , ..., b s będą dowolnymi względnie pierwszymi liczbami całkowitymi większymi niż 1. Zdefiniuj
Wtedy istnieje stała C zależna tylko od b 1 , ..., b s , taka że ciąg { x ( n )} n ≥1 jest ciągiem s- wymiarowym z
Zestaw Hammersley
Niech b 1 , ..., b s -1 być względnie pierwsze dodatnie liczby całkowite większe od 1. Na podane s i N The s wymiarową Hammersley zestaw rozmiarów N jest określona przez
dla n = 1, ..., N . Następnie
gdzie C jest stałą zależną tylko od b 1 , ..., b s -1 . Uwaga: Wzory pokazują, że zbiór Hammersleya jest w rzeczywistości sekwencją Haltona, ale otrzymujemy jeszcze jeden wymiar za darmo, dodając przeciągnięcie liniowe. Jest to możliwe tylko wtedy, gdy N jest znane z góry. Zbiór liniowy jest również ogólnie zbiorem o najmniejszej możliwej rozbieżności jednowymiarowej. Niestety, dla wyższych wymiarów nie są znane takie „zestawy rekordów rozbieżności”. Dla s = 2, większość generatorów zestawu punktów o małej rozbieżności dostarcza co najmniej rozbieżności bliskie optymalnej.
Sekwencja Sobola
Wariant Antonowa-Saleeva sekwencji Sobola generuje liczby od zera do jedynki bezpośrednio jako binarne ułamki długości , ze zbioru specjalnych ułamków binarnych, zwanych liczbami kierunkowymi. Bity kodu Grey z , , służą do wybierania numerów kierunkowych. Aby uzyskać wartość sekwencji Sobola, weź wyłączną lub binarną wartość kodu Graya z odpowiednim numerem kierunkowym. Liczba wymaganych wymiarów wpływa na wybór .
Próbkowanie dysku Poissona
Próbkowanie dysku Poissona jest popularne w grach wideo do szybkiego umieszczania obiektów w sposób, który wydaje się losowo wyglądać, ale gwarantuje, że co dwa punkty są oddzielone co najmniej określoną minimalną odległością. Nie gwarantuje to małej rozbieżności (jak np. Sobol), ale przynajmniej znacznie mniejszej rozbieżności niż czysto losowe próbkowanie. Cel tych wzorców próbkowania opiera się na analizie częstotliwości, a nie na rozbieżności, rodzaju tak zwanych wzorców „niebieskiego szumu”.
Przykłady graficzne
Punkty narysowane poniżej to pierwsze 100, 1000 i 10000 elementów w sekwencji typu Sobola. Dla porównania pokazano również 10000 elementów ciągu punktów pseudolosowych. Sekwencja o małej rozbieżności została wygenerowana przez algorytm TOMS 659. Implementacja algorytmu w Fortran jest dostępna z Netlib .
Zobacz też
Uwagi
Bibliografia
- Josef Dick i Friedrich Pillichshammer, Sieci i sekwencje cyfrowe. Teoria rozbieżności i integracja Quasi-Monte Carlo , Cambridge University Press, Cambridge, 2010, ISBN 978-0-521-19159-3
- Kuipers, L.; Niederreiter, H. (2005), Jednolity rozkład sekwencji , Dover Publications , ISBN 0-486-45019-8
- Haralda Niederreitera . Generowanie liczb losowych i metody quasi-Monte Carlo. Towarzystwo Matematyki Przemysłowej i Stosowanej, 1992. ISBN 0-89871-295-5
- Michael Drmota i Robert F. Tichy, Sekwencje, rozbieżności i zastosowania , Lecture Notes in Math., 1651, Springer, Berlin, 1997, ISBN 3-540-62606-9
- William H. Press, Brian P. Flannery, Saul A. Teukolsky, William T. Vetterling. Przepisy numeryczne w C . Cambridge, Wielka Brytania: Cambridge University Press, wydanie drugie 1992. ISBN 0-521-43108-5 (patrz rozdział 7.7 dla mniej technicznej dyskusji o sekwencjach o małej rozbieżności)
Linki zewnętrzne
- Zebrane algorytmy ACM (patrz algorytmy 647, 659 i 738.)
- Sekwencje quasi-losowe z Biblioteki Naukowej GNU
- Próbkowanie quasi-losowe z zastrzeżeniem ograniczeń w FinancialMathematics.Com
- Generator C++ sekwencji Sobola