Modelowanie blokowe - Blockmodeling

Blockmodeling jest zbiorem lub spójną strukturą , która jest wykorzystywana do analizy struktury społecznej, a także do ustalania procedur podziału (klastrowania) jednostek sieci społecznościowych ( węzły , wierzchołki , aktorzy ), w oparciu o określone wzorce, które tworzą wyróżniająca się struktura dzięki połączeniom. Jest używany przede wszystkim w statystyce , uczeniu maszynowym i nauce o sieciach .

Jako procedura empiryczna , modelowanie blokowe zakłada, że ​​wszystkie jednostki w danej sieci mogą być zgrupowane w takim stopniu, w jakim są one równoważne. Jeśli chodzi o równoważność, może być strukturalna, regularna lub uogólniona. Korzystając z modelowania blokowego, sieć może być analizowana za pomocą nowo utworzonych modeli blokowych , co przekształca dużą i złożoną sieć w mniejszą i bardziej zrozumiałą. Jednocześnie modelowanie blokowe służy do operacjonalizacji ról społecznych .

Podczas gdy niektórzy twierdzą, że modelowanie blokowe jest tylko metodami grupowania, Bonacich i McConaghy stwierdzają, że „jest to ugruntowane teoretycznie i algebraiczne podejście do analizy struktury relacji”. Unikalna zdolność modelowania blokowego polega na tym, że uwzględnia on strukturę nie tylko jako zbiór relacji bezpośrednich, ale uwzględnia również wszystkie inne możliwe relacje złożone, które opierają się na relacjach bezpośrednich.

Zasady modelowania blokowego zostały po raz pierwszy wprowadzone przez Francois Lorraina i Harrisona C. White'a w 1971 roku. Modelowanie blokowe jest uważane za „ważny zestaw narzędzi analizy sieci”, ponieważ zajmuje się wyznaczaniem struktur ról (dobrze zdefiniowanych miejsc w strukturach społecznych, znane jako pozycje) oraz rozpoznawanie podstawowej struktury sieci społecznościowych. Według Batagelja głównym „celem modelowania blokowego jest zredukowanie dużej, potencjalnie niespójnej sieci do mniejszej, zrozumiałej struktury, którą można łatwiej zinterpretować”. Modelowanie blokowe było początkowo używane do analizy w socjometrii i psychometrii , ale teraz rozprzestrzeniło się również na inne nauki.

Definicja

Różne cechy sieci społecznościowych. A, B i C pokazują różną centralność i gęstość sieci; Panel D pokazuje zamknięcie sieci, tj. gdy dwóch aktorów związanych ze wspólnym trzecim aktorem, również tworzy między sobą bezpośrednią więź. Panel E reprezentuje dwóch aktorów o różnych atrybutach (np. przynależność organizacyjna, przekonania, płeć, wykształcenie), którzy mają tendencję do tworzenia więzi. Panel F składa się z dwóch rodzajów więzi: przyjaźni (linia ciągła) i niechęci (linia przerywana). W tym przypadku dwoje aktorów będących przyjaciółmi nie lubi wspólnej trzeciej osoby (lub, podobnie, dwóch aktorów, którzy nie lubią wspólnej trzeciej osoby, jest zazwyczaj przyjaciółmi).

Sieć jako system składa się (lub definiuje) z dwóch różnych zestawów: jednego zestawu jednostek (węzłów, wierzchołków, aktorów) i jednego zestawu powiązań między jednostkami. Wykorzystując oba zestawy można stworzyć graf opisujący strukturę sieci.

Podczas modelowania blokowego badacz staje przed dwoma problemami: jak podzielić jednostki (np. jak określić klastry (lub klasy), które następnie tworzą wierzchołki w modelu blokowym), a następnie jak określić powiązania w modelu blokowym (i na jednocześnie wartości tych linków).

Analizując sieć społecznościową (w naukach społecznych ), sieci są zazwyczaj sieciami społecznościowymi , składającymi się z kilku osób (jednostek) i wybranych relacji społecznych między nimi (linków). Ponieważ takie sieci w świecie rzeczywistym mogą być duże i złożone, stosuje się modelowanie blokowe w celu uproszczenia ich w mniejsze struktury, które mogą być znacznie łatwiejsze do zinterpretowania. W szczególności modelowanie blokowe dzieli jednostki na klastry, a następnie określa powiązania między wspomnianymi klastrami. Jednocześnie modelowanie blokowe może być wykorzystane do wyjaśnienia ról społecznych , istniejących w takiej sieci, ponieważ zakłada się, że utworzony klaster jednostek naśladuje (lub jest ściśle powiązany) z rolami społecznymi jednostek.

W teorii grafów obraz przedstawia uproszczony widok sieci, w którym każda z liczb reprezentuje inny węzeł.

Modelowanie blokowe można zatem zdefiniować jako zestaw podejść do podziału jednostek na klastry (znane również jako pozycje) i powiązania na bloki, które są dalej definiowane przez nowo uzyskane klastry. Blok (również model blokowy) jest zdefiniowany jako podmacierz, która pokazuje wzajemne połączenia (połączenia) między węzłami, obecne w tym samym lub różnych klastrach. Każda z tych pozycji w klastrze jest określona przez zestaw (nie)bezpośrednich powiązań z innymi pozycjami społecznymi iz innych pozycji. Te linki (połączenia) mogą być skierowane lub niekierowane; może istnieć wiele powiązań między tą samą parą obiektów lub mogą one mieć na nich wagi. Jeśli w sieci nie ma wielu łączy, nazywa się to siecią prostą.

Macierz (która może być również pokazana jako wykres) składa się z uporządkowanych jednostek, w wierszach i kolumnach, na podstawie ich nazw. Takie uporządkowane jednostki są następnie dzielone (partycjonowane) na podstawie podobieństwa: jednostki o podobnych wzorcach powiązań są dzielone razem w tych samych klastrach. Klastry są następnie układane razem, dzięki czemu jednostki z tych samych klastrów są umieszczane obok siebie, zachowując w ten sposób łączność. W kolejnym kroku jednostki (z tych samych klastrów) są przekształcane w model blokowy. Dzięki temu powstaje zwykle kilka modeli blokowych, z których jeden jest klastrem rdzenia, a inne są spójne; klaster rdzeniowy jest zawsze połączony ze spójnymi, natomiast spójnych nie można ze sobą łączyć. Grupowanie węzłów opiera się na równoważności , takiej jak strukturalna i regularna. Nadrzędnym celem postaci macierzowej jest wizualne przedstawienie relacji między osobami wchodzącymi w skład klastra. Te powiązania są kodowane dychotomicznie (jako obecne lub nieobecne), a wiersze w postaci macierzowej wskazują źródło powiązań, a kolumny oznaczają przeznaczenie tych powiązań.

Równoważność może mieć dwa podstawowe podejścia: jednostki równoważne mają ten sam wzór połączenia z tymi samymi sąsiadami lub jednostki te mają taki sam lub podobny wzór połączenia z różnymi sąsiadami. Jeżeli jednostki są połączone z resztą sieci w identyczny sposób, to są strukturalnie równoważne. Jednostki mogą być również regularnie równoważne, gdy są równoważnie połączone z innymi równoważnymi.

W przypadku modelowania blokowego konieczne jest uwzględnienie kwestii wyników obarczonych błędami pomiarowymi w początkowej fazie pozyskiwania danych.

Różne podejścia

W odniesieniu do tego, jaki rodzaj sieci jest modelowany blokowo, konieczne jest inne podejście. Sieci mogą być jednomodowe lub dwumodowe. W pierwszym przypadku wszystkie jednostki mogą być połączone z dowolną inną jednostką i tam, gdzie jednostki są tego samego typu, podczas gdy w drugim jednostki są połączone tylko z jednostkami innego typu. Jeśli chodzi o relacje między jednostkami, mogą to być sieci jednorelacyjne lub wielorelacyjne. Co więcej, sieci mogą być sieciami czasowymi lub wielopoziomowymi, a także binarnymi (tylko 0 i 1) lub ze znakiem (pozwalającym na wiązanie ujemne)/wartościami (możliwe są inne wartości).

Różne podejścia do modelowania blokowego można podzielić na dwie główne klasy: modelowanie deterministyczne i podejścia do modelowania blokowego stochastycznego . Deterministyczne modelowanie blokowe dzieli się następnie na bezpośrednie i pośrednie podejścia do modelowania blokowego.

Równoważność strukturalna

Wśród podejść do bezpośredniego modelowania blokowego są: równoważność strukturalna i równoważność regularna . Równoważność strukturalna to stan, w którym jednostki są połączone z resztą sieci w identyczny sposób, podczas gdy regularna równoważność występuje, gdy jednostki są w równym stopniu powiązane z innymi równoważnymi (jednostki niekoniecznie dzielą sąsiadów, ale mają sąsiadów, którzy sami są podobny).

Regularna równoważność

Pośredni blockmodeling podejścia, w którym podział jest traktowany jako tradycyjnym problemem analizy skupień (pomiar (DIS) similarty Wyniki W (DIS) similartiy matrycy), są następujące:

Według Brusco i Steinleya (2011) modelowanie blokowe można podzielić na kategorie (przy użyciu kilku wymiarów):

Stworzenie modelu blokowego

W zasadzie modelowanie blokowe, jako proces, składa się z trzech etapów. W pierwszym kroku określana jest liczba jednostek. Po tym następuje (w drugim kroku) wybór lub określenie dozwolonych bloków, które wystąpią, a być może także lokalizacji w macierzy. W ostatnim, trzecim kroku, za pomocą programu komputerowego, dokonuje się podziału jednostek według zadanych warunków i dodatkowo dobiera się ostateczną macierz dla uzyskanego modelu. Dzięki temu tworzony jest model blokowy .

Programy specjalistyczne

Modelowanie blokowe odbywa się za pomocą specjalistycznych programów komputerowych , dedykowanych do analizy sieci lub modelowania blokowego w szczególności takich jak:

Zobacz też

Bibliografia