Sekwencja o małej rozbieżności - Low-discrepancy sequence

W matematyce ciąg o małej rozbieżności jest ciągiem o własności, że dla wszystkich wartości N , jego podciąg x 1 , ..., x N ma małą rozbieżność .

Z grubsza rzecz biorąc, rozbieżność sekwencji jest niska, jeśli proporcja punktów w sekwencji należących do dowolnego zbioru B jest blisko proporcjonalna do środka z B , jak stałoby się przeciętnie (ale nie dla poszczególnych próbek) w przypadku equidistributed sekwencji . Konkretne definicje rozbieżności różnią się w odniesieniu do wyboru B ( hipersfery , hipersześciany itp.) oraz sposobu obliczania rozbieżności dla każdego B (zwykle znormalizowanego) i łączenia (zwykle poprzez przyjęcie najgorszej wartości).

Ciągi o małej rozbieżności nazywane są również ciągami quasilosowymi , ze względu na ich powszechne zastosowanie jako zamiennik liczb losowych o rozkładzie jednostajnym . Modyfikator „quasi” służy do wyraźniejszego zaznaczenia, że ​​wartości ciągu o małej rozbieżności nie są ani losowe, ani pseudolosowe , ale takie ciągi mają pewne właściwości zmiennych losowych i w niektórych zastosowaniach, takich jak metoda quasi-Monte Carlo, mają mniejszą rozbieżność to ważna zaleta.

Aplikacje

Błąd w szacowanej kurtozie jako funkcja liczby punktów danych. 'Dodatkowe quasilosowe' daje maksymalny błąd, gdy c  = ( 5  − 1)/2. „Losowe” daje średni błąd w sześciu ciągach liczb losowych, gdzie średnia jest brana pod uwagę w celu zmniejszenia wielkości dzikich fluktuacji

Liczby quasilosowe mają przewagę nad czystymi liczbami losowymi, ponieważ szybko i równomiernie pokrywają interesującą dziedzinę. Mają przewagę nad czysto deterministycznymi metodami, ponieważ metody deterministyczne zapewniają wysoką dokładność tylko wtedy, gdy liczba punktów danych jest wstępnie ustawiona, podczas gdy przy użyciu sekwencji quasi-losowych dokładność zwykle poprawia się w sposób ciągły, gdy dodawanych jest więcej punktów danych, z pełnym ponownym wykorzystaniem istniejących punktów. Z drugiej strony zbiory punktów quasi-losowych mogą mieć znacznie mniejszą rozbieżność dla danej liczby punktów niż ciągi czysto losowe.

Przydatnym zastosowania to znalezienia funkcji charakterystycznej o funkcji gęstości prawdopodobieństwa , i znalezienie pochodnej funkcji deterministycznej funkcji z niewielką ilością szumów. Liczby quasilosowe umożliwiają bardzo szybkie obliczenie momentów wyższego rzędu z dużą dokładnością.

Zastosowania, które nie wymagają sortowania, to znajdowanie średniej , odchylenia standardowego , skośności i kurtozy rozkładu statystycznego oraz znajdowanie całkowitych i globalnych maksimów i minimów trudnych funkcji deterministycznych. Liczby quasilosowe mogą być również używane do dostarczania punktów początkowych dla algorytmów deterministycznych, które działają tylko lokalnie, takich jak iteracja Newtona-Raphsona .

Liczby quasilosowe można również łączyć z algorytmami wyszukiwania. Algorytm w stylu Quicksort drzewa binarnego powinien działać wyjątkowo dobrze, ponieważ liczby quasilosowe spłaszczają drzewo znacznie lepiej niż liczby losowe, a im bardziej płaskie drzewo, tym szybsze sortowanie. Z algorytmu wyszukiwania, numery quasirandom mogą być wykorzystywane w celu znalezienia tryb , mediana , przedziały ufności i skumulowany rozkład z rozkładem statystycznym, a wszystkie lokalne minima i wszystkie rozwiązania funkcji deterministycznych.

Ciągi o małej rozbieżności w całkowaniu numerycznym

Co najmniej trzy metody całkowania numerycznego można sformułować w następujący sposób. Mając zbiór { x 1 , ..., x N } w przedziale [0,1], aproksymuj całkę funkcji f jako średnią z funkcji obliczonej w tych punktach:

Jeśli punkty są wybrane jako x i = i / N , jest to reguła prostokąta . Jeśli punkty są wybierane do losowego (lub pseudolosowego ) rozdzielenia, jest to metoda Monte Carlo . Jeżeli punkty są wybrane jako elementy ciągu o małej rozbieżności, jest to metoda quasi-Monte Carlo . Godny uwagi wynik, nierówność Koksmy-Hlawki (podana poniżej), pokazuje, że błąd takiej metody może być ograniczony iloczynem dwóch wyrazów, z których jeden zależy tylko od f , a drugi to rozbieżność zbioru { x 1 , ..., x N }.

Jest wygodne, aby skonstruować zestaw { x 1 , ..., x N }, w taki sposób, że jeśli zbiór z N +1 elementów jest zbudowana, poprzednie N elementy nie muszą być ponownie obliczonych. Reguła prostokąta wykorzystuje zestaw punktów, które mają małą rozbieżność, ale ogólnie elementy muszą być przeliczone, jeśli N jest zwiększone. Elementy nie muszą być przeliczane w losowej metodzie Monte Carlo, jeśli N jest zwiększone, ale zbiory punktów nie mają minimalnej rozbieżności. Używając sekwencji o małej rozbieżności, dążymy do małej rozbieżności i nie ma potrzeby ponownego obliczania, ale w rzeczywistości sekwencje o małej rozbieżności mogą być przyrostowo dobre tylko w przypadku rozbieżności, jeśli nie pozwolimy na ponowne przeliczenie.

Definicja rozbieżności

Rozbieżność o zadanej P = { x 1 , ..., x N } zdefiniowano za pomocą Niederreiter w notacji jako

gdzie λ s jest s- wymiarową miarą Lebesgue'a , A ( B ; P ) jest liczbą punktów w P , które wpadają w B , a J jest zbiorem s- wymiarowych przedziałów lub pudełek postaci

gdzie .

Gwiazdy rozbieżność D * N ( P ) jest określony w podobny sposób, z tym że Supremum przejmuje zestaw J * pudeł prostokątnych formie

gdzie u i jest w przedziale półotwartym [0, 1).

Oba są powiązane przez

Uwaga: W przypadku tych definicji rozbieżność reprezentuje najgorszy przypadek lub maksymalne odchylenie gęstości punktów jednolitego zestawu. Istotne są jednak również inne miary błędów, co prowadzi do innych definicji i miar zmienności. Na przykład, rozbieżność L2 lub zmodyfikowana wyśrodkowana rozbieżność L2 są również intensywnie wykorzystywane do porównywania jakości jednolitych zbiorów punktów. Oba są znacznie łatwiejsze do obliczenia dla dużych N i s.

Nierówność Koksmy–Hławki

Niech Ī s będzie s- wymiarowym sześcianem jednostkowym, Ī s = [0, 1] × ... × [0, 1]. Niech f ma ograniczoną wariację V ( f ) na Ī s w sensie Hardy'ego i Krausego. Wtedy dla dowolnego x 1 , ..., x N w I s = [0, 1) × ... × [0, 1),

Koksma - Hlawka nierówność jest ostry w następującym sensie: Dla każdego zestawu punktów { x 1 , ..., x N } w I a i każda znajduje się funkcja f o ograniczonej zmienności i V, ( f ) = 1, tak że

Dlatego jakość liczbowej reguły całkowania zależy tylko od rozbieżności D * N ( x 1 ,..., x N ).

Formuła Hławki-Zaremby

Niech . Bo piszemy

i oznaczać przez punkt otrzymany z x przez zastąpienie współrzędnych nie w u przez . Następnie

gdzie jest funkcja rozbieżności.

Wersja nierówności Koksma-Hlawka

Stosując nierówność Cauchy'ego-Schwarza dla całek i sum do tożsamości Hławki-Zaremby otrzymujemy wersję nierówności Koksmy-Hlawki:

gdzie

i

Rozbieżność L2 ma duże znaczenie praktyczne, ponieważ dla danego zbioru punktów możliwe są szybkie obliczenia jawne. W ten sposób łatwo jest tworzyć optymalizatory zestawu punktów, używając jako kryterium rozbieżności L2.

Nierówność Erdősa–Turana–Koksmy

Obliczeniowo trudno jest znaleźć dokładną wartość rozbieżności dużych zbiorów punktów. Erdős - Turan - Koksma nierówność stanowi górną granicę.

Niech x 1 ,..., x N będą punktami w I s a H będzie dowolną dodatnią liczbą całkowitą. Następnie

gdzie

Główne przypuszczenia

Hipoteza 1. Istnieje stała c s zależna tylko od wymiaru s , taka, że

dla dowolnego zbioru punktów skończonych { x 1 ,..., x N }.

Hipoteza 2. Istnieje stała c ' s zależna tylko od s , taka, że

dla nieskończonej liczby N dla dowolnej nieskończonej sekwencji x 1 , x 2 , x 3 ,....

Te przypuszczenia są równoważne. Zostały one udowodnione dla s ≤ 2 przez WM Schmidta . W wyższych wymiarach odpowiedni problem jest wciąż otwarty. Najbardziej znane dolne granice należą do Michaela Laceya i współpracowników.

Dolne granice

Niech s  = 1. Wtedy

dla dowolnego zbioru punktów skończonych { x 1 , ...,  x N }.

Niech s  = 2. WM Schmidt udowodnił, że dla dowolnego zbioru punktów skończonych { x 1 , ...,  x N },

gdzie

Dla dowolnych wymiarów s  > 1 KF Roth udowodnił, że

dla dowolnego zbioru punktów skończonych { x 1 , ...,  x N }. Józef Beck ustalił dwukrotną poprawę tego wyniku w trzech wymiarach. Zostało to ulepszone przez D. Bilyka i MT Lacey do potęgi pojedynczego logarytmu. Najbardziej znanym wiązaniem dla s  > 2 są D. Bilyk i MT Lacey oraz A. Vagharshakyan. Dla s  > 2 istnieje t  > 0, więc

dla dowolnego zbioru punktów skończonych { x 1 , ...,  x N }.

Konstruowanie ciągów o małej rozbieżności

Ponieważ dowolny rozkład liczb losowych może być odwzorowany na rozkład jednostajny, a liczby quasi-losowe są odwzorowane w ten sam sposób, ten artykuł dotyczy tylko generowania liczb quasi-losowych na wielowymiarowym rozkładzie jednostajnym.

Znane są konstrukcje sekwencji, takie, że

gdzie C jest pewną stałą, w zależności od sekwencji. Po hipotezie 2 uważa się, że sekwencje te mają najlepszą możliwą kolejność zbieżności. Poniższe przykłady są van der sekwencji Corput , w sekwencji Halton , oraz sekwencji Sobol . Jednym z ogólnych ograniczeń jest to, że metody konstrukcyjne mogą zwykle gwarantować tylko porządek zbieżności. Praktycznie małą rozbieżność można osiągnąć tylko wtedy, gdy N jest wystarczająco duże, a dla dużych danych s to minimalne N może być bardzo duże. Oznacza to, że przeprowadzenie analizy Monte-Carlo z np. s=20 zmiennymi i N=1000 punktów z generatora sekwencji o małej rozbieżności może zapewnić tylko bardzo niewielką poprawę dokładności.

Losowe liczby

Sekwencje liczb quasilosowych można generować z liczb losowych, nakładając ujemną korelację na te liczby losowe. Jednym ze sposobów, aby to zrobić, aby rozpocząć z zestawem liczb losowych na i cyfr konstrukt quasirandom które są jednorodne na podstawie:

dla nieparzystych i do wieczora.

Drugim sposobem na zrobienie tego z początkowymi liczbami losowymi jest skonstruowanie błądzenia losowego z przesunięciem 0.5, jak w:

Oznacza to, że weź poprzednią liczbę quasilosową, dodaj 0,5 i liczbę losową i weź wynik modulo  1.

W przypadku więcej niż jednego wymiaru można użyć kwadratów łacińskich o odpowiednim wymiarze, aby zapewnić przesunięcia, aby zapewnić równomierne pokrycie całej domeny.

Pokrycie kwadratu jednostkowego. Po lewej dla addytywnych liczb quasi-losowych z c  = 0.5545497..., 0.308517... Po prawej dla liczb losowych. Od góry do dołu. 10, 100, 1000, 10000 punktów.

Nawrót addytywny

Dla każdego irracjonalnego sekwencja

ma rozbieżności zmierzające do . Zauważ, że sekwencja może być zdefiniowana rekurencyjnie przez

Dobra wartość daje mniejszą rozbieżność niż ciąg niezależnych jednolitych liczb losowych.

Rozbieżność może być ograniczony przez wykładnik aproksymacji z . Jeśli wykładnikiem aproksymacji jest , to dla any , obowiązuje następujące ograniczenie:

Według twierdzenia Thue-Siegla-Rotha wykładnik aproksymacji dowolnej niewymiernej liczby algebraicznej wynosi 2, co daje granicę powyżej.

Powyższa relacja rekurencyjna jest podobna do relacji rekurencyjnej używanej przez liniowy generator kongruencji , niskiej jakości generator liczb pseudolosowych:

Dla powyższej, addytywnej powtarzalności o niskiej rozbieżności, aim są wybierane jako 1. Należy jednak pamiętać, że nie spowoduje to wygenerowania niezależnych liczb losowych, więc nie powinno być używane do celów wymagających niezależności.

Wartość z najmniejszą rozbieżnością to

Inną wartością, która jest prawie tak dobra, jest:

W więcej niż jednym wymiarze dla każdego wymiaru potrzebne są oddzielne liczby quasi-losowe. Wygodny zestaw wartości, które są używane, to pierwiastki kwadratowe liczb pierwszych od dwóch w górę, wszystkie wzięte modulo 1:

Wykazano jednak, że zestaw wartości opartych na uogólnionym złotym podziale daje bardziej równomiernie rozłożone punkty.

Lista generator liczb pseudolosowych metod list do generowania liczb pseudolosowych niezależnych. Uwaga: W kilku wymiarach rekurencyjna rekurencja prowadzi do jednolitych zbiorów dobrej jakości, ale dla większych s (takich jak s>8) inne generatory zbiorów punktów mogą oferować znacznie mniejsze rozbieżności.

Sekwencja van der Corputa

Pozwolić

będzie b- arną reprezentacją dodatniej liczby całkowitej n ≥ 1, tj. 0 ≤ d k ( n ) < b . Zestaw

Wtedy istnieje stała C zależna tylko od b taka, że ​​( g b ( n )) n ≥ 1 spełnia

gdzie D * N jest rozbieżnością gwiazdy .

Sekwencja Haltona

Pierwsze 256 punktów ciągu (2,3) Haltona

Sekwencja Haltona jest naturalnym uogólnieniem sekwencji van der Corputa do wyższych wymiarów. Niech s będzie dowolnym wymiarem, a b 1 , ..., b s będą dowolnymi względnie pierwszymi liczbami całkowitymi większymi niż 1. Zdefiniuj

Wtedy istnieje stała C zależna tylko od b 1 , ..., b s , taka że ciąg { x ( n )} n ≥1 jest ciągiem s- wymiarowym z

Zestaw Hammersley

Zestaw 2D Hammersley w rozmiarze 256

Niech b 1 , ..., b s -1 być względnie pierwsze dodatnie liczby całkowite większe od 1. Na podane s i N The s wymiarową Hammersley zestaw rozmiarów N jest określona przez

dla n = 1, ..., N . Następnie

gdzie C jest stałą zależną tylko od b 1 , ..., b s -1 . Uwaga: Wzory pokazują, że zbiór Hammersleya jest w rzeczywistości sekwencją Haltona, ale otrzymujemy jeszcze jeden wymiar za darmo, dodając przeciągnięcie liniowe. Jest to możliwe tylko wtedy, gdy N jest znane z góry. Zbiór liniowy jest również ogólnie zbiorem o najmniejszej możliwej rozbieżności jednowymiarowej. Niestety, dla wyższych wymiarów nie są znane takie „zestawy rekordów rozbieżności”. Dla s  = 2, większość generatorów zestawu punktów o małej rozbieżności dostarcza co najmniej rozbieżności bliskie optymalnej.

Sekwencja Sobola

Wariant Antonowa-Saleeva sekwencji Sobola generuje liczby od zera do jedynki bezpośrednio jako binarne ułamki długości , ze zbioru specjalnych ułamków binarnych, zwanych liczbami kierunkowymi. Bity kodu Grey z , , służą do wybierania numerów kierunkowych. Aby uzyskać wartość sekwencji Sobola, weź wyłączną lub binarną wartość kodu Graya z odpowiednim numerem kierunkowym. Liczba wymaganych wymiarów wpływa na wybór .

Próbkowanie dysku Poissona

Próbkowanie dysku Poissona jest popularne w grach wideo do szybkiego umieszczania obiektów w sposób, który wydaje się losowo wyglądać, ale gwarantuje, że co dwa punkty są oddzielone co najmniej określoną minimalną odległością. Nie gwarantuje to małej rozbieżności (jak np. Sobol), ale przynajmniej znacznie mniejszej rozbieżności niż czysto losowe próbkowanie. Cel tych wzorców próbkowania opiera się na analizie częstotliwości, a nie na rozbieżności, rodzaju tak zwanych wzorców „niebieskiego szumu”.

Przykłady graficzne

Punkty narysowane poniżej to pierwsze 100, 1000 i 10000 elementów w sekwencji typu Sobola. Dla porównania pokazano również 10000 elementów ciągu punktów pseudolosowych. Sekwencja o małej rozbieżności została wygenerowana przez algorytm TOMS 659. Implementacja algorytmu w Fortran jest dostępna z Netlib .

Pierwsze 100 punktów w sekwencji o małej rozbieżności typu Sobol .
Pierwsze 1000 punktów w tej samej kolejności. Te 1000 to pierwsze 100, z 900 dodatkowymi punktami.
Pierwsze 10000 punktów w tej samej kolejności. Te 10000 stanowią pierwsze 1000, z 9000 więcej punktów.
Dla porównania, oto pierwsze 10000 punktów w ciągu równomiernie rozłożonych liczb pseudolosowych. Widoczne są regiony o większej i mniejszej gęstości.

Zobacz też

Uwagi

Bibliografia

  • Josef Dick i Friedrich Pillichshammer, Sieci i sekwencje cyfrowe. Teoria rozbieżności i integracja Quasi-Monte Carlo , Cambridge University Press, Cambridge, 2010, ISBN  978-0-521-19159-3
  • Kuipers, L.; Niederreiter, H. (2005), Jednolity rozkład sekwencji , Dover Publications , ISBN 0-486-45019-8
  • Haralda Niederreitera . Generowanie liczb losowych i metody quasi-Monte Carlo. Towarzystwo Matematyki Przemysłowej i Stosowanej, 1992. ISBN  0-89871-295-5
  • Michael Drmota i Robert F. Tichy, Sekwencje, rozbieżności i zastosowania , Lecture Notes in Math., 1651, Springer, Berlin, 1997, ISBN  3-540-62606-9
  • William H. Press, Brian P. Flannery, Saul A. Teukolsky, William T. Vetterling. Przepisy numeryczne w C . Cambridge, Wielka Brytania: Cambridge University Press, wydanie drugie 1992. ISBN  0-521-43108-5 (patrz rozdział 7.7 dla mniej technicznej dyskusji o sekwencjach o małej rozbieżności)

Linki zewnętrzne