Model losowego wykresu o maksymalnej entropii - Maximum-entropy random graph model

Losowe modele grafów o maksymalnej entropiilosowymi modelami grafów używanymi do badania złożonych sieci podlegających zasadzie maksymalnej entropii w ramach zestawu ograniczeń strukturalnych, które mogą być globalne, dystrybucyjne lub lokalne.

Przegląd

Wszelkie przypadkowy wzór wykresu (przy stałym zestawem wartości parametrów) daje w wyniku rozkładu prawdopodobieństwa na wykresach , a te, które są maksymalna entropia wewnątrz badanym klasy rozkładów mają szczególną właściwość bycia maksymalnie bezstronne modele zerowe dla wnioskowania sieci (np sieć biologiczny wnioskowanie ). Każdy model definiuje rodzinę rozkładów prawdopodobieństwa na zbiorze wykresów o wielkości (dla każdego dla jakiejś skończonej ), sparametryzowanych przez zbiór ograniczeń na obserwablach zdefiniowanych dla każdego wykresu (takich jak ustalony oczekiwany średni stopień , rozkład stopni w określonej postaci, lub sekwencja stopni ), wymuszona w rozkładzie grafowym wraz z maksymalizacją entropii metodą mnożników Lagrange'a . Zauważ, że w tym kontekście „maksymalna entropia” nie odnosi się do entropii pojedynczego wykresu , ale raczej do entropii całego probabilistycznego zbioru losowych grafów.

Kilka powszechnie badanych losowych modeli sieci to w rzeczywistości maksymalna entropia, na przykład wykresy ER i (z których każdy ma jedno globalne ograniczenie liczby krawędzi), a także model konfiguracji (CM). i miękki model konfiguracji (SCM) (z których każdy ma lokalne ograniczenia, po jednym dla każdego węzłowego stopnia-wartości). W obu wspomnianych wyżej parach modeli istotne rozróżnienie dotyczy tego, czy ograniczenie jest ostre (tj. Spełniane przez każdy element zbioru wykresów rozmiarów z niezerowym prawdopodobieństwem w zespole), czy miękkie (tj. Spełnione średnio w całym ensemble). Pierwszy (ostry) przypadek odpowiada zespołowi mikrokanonicznemu , warunkowi maksymalnej entropii dającej wszystkie wykresy spełniające jako równoważne; ten drugi (miękki) przypadek jest kanoniczny , tworząc wykładniczy model wykresu losowego (ERGM).

Model Typ ograniczenia Zmienna ograniczenia Rozkład prawdopodobieństwa
ER , Ostry, globalny Całkowita liczba krawędzi
ER , Miękkie, globalne Oczekiwana łączna liczba krawędzi
Model konfiguracji Ostry, lokalny Stopień każdego wierzchołka,
Model konfiguracji miękkiej Miękkie, lokalne Oczekiwany stopień każdego wierzchołka,

Kanoniczny zbiór wykresów (ramy ogólne)

Załóżmy, że budujemy losowy modelu diagram składający się z rozkładem prawdopodobieństwa na zbiorze z prostych wykresów z wierzchołków. Gibbs entropia tego zespołu zostanie podana przez

Chcielibyśmy, aby wartości obserwowalne uśrednione w zespole (takie jak średni stopień , średnie grupowanie lub średnia najkrótsza długość ścieżki ) były dostrajalne, więc nakładamy „miękkie” ograniczenia na rozkład wykresu:

gdzie oznacz ograniczenia. Zastosowanie metody mnożników Lagrange'a do wyznaczenia rozkładu maksymalizującego przy spełnieniu warunku normalizacji daje następujące wyniki:

gdzie jest stałą normalizującą ( funkcja podziału ) i są parametrami (mnożnikami Lagrange'a) sprzężonymi z odpowiednio indeksowanymi obserwowalnymi wykresami, które można dostroić, aby uzyskać średnio próbki wykresu o pożądanych wartościach tych właściwości; wynikiem jest wykładnicza rodzina i zespół kanoniczny ; konkretnie dając ERGM .

Model Erdősa – Rényiego

W powyższym układzie kanonicznym ograniczenia zostały nałożone na wartości uśrednione w zespole . Chociaż te właściwości będą średnio przyjmować wartości określone przez odpowiednie ustawienie , może to mieć każdy konkretny przypadek , co może być niepożądane. Zamiast tego możemy narzucić znacznie bardziej rygorystyczny warunek: każdy wykres z niezerowym prawdopodobieństwem musi dokładnie spełniać . Pod tymi „ostrymi” ograniczeniami wyznaczany jest rozkład maksymalnej entropii. Przykładem tego jest model Erdősa – Rényiego .

Ostre ograniczenie polega na ustalonej liczbie krawędzi , to znaczy na wszystkich wykresach narysowanych ze zbioru (utworzonych z oznaczonym prawdopodobieństwem ). To ogranicza przestrzeń próbkowania od (wszystkie wykresy na wierzchołkach) do podzbioru . Jest to bezpośrednia analogia do zespołu mikrokanonicznego w klasycznej mechanice statystycznej , w którym system jest ograniczony do cienkiej rozmaitości w przestrzeni fazowej wszystkich stanów o określonej wartości energii .

Po ograniczeniu naszej przestrzeni próbkowania do , nie mamy żadnych zewnętrznych ograniczeń (poza normalizacją) do spełnienia, dlatego wybierzemy maksymalizację bez korzystania z mnożników Lagrange'a. Powszechnie wiadomo, że rozkład maksymalizujący entropię przy braku ograniczeń zewnętrznych jest równomiernym rozkładem w przestrzeni próbki (patrz rozkład prawdopodobieństwa maksymalnej entropii ), z którego otrzymujemy:

gdzie ostatni wyraz w kategoriach Symbol Newtona jest wiele sposobów na miejsce krawędziach wśród możliwych krawędzi , a więc jest to liczność od .

Uogólnienia

Badano różne zespoły maksymalnej entropii na uogólnieniach prostych wykresów. Należą do nich na przykład zespoły uproszczonych kompleksów i ważone losowe wykresy z zadaną sekwencją oczekiwanego stopnia

Zobacz też

Bibliografia