Analiza boolowska - Boolean analysis
Analiza boolowska została wprowadzona przez Flamenta (1976). Celem analizy Boole'a jest wykrycie deterministycznych zależności między pozycjami kwestionariusza lub podobnymi strukturami danych w obserwowanych wzorcach odpowiedzi. Te deterministyczne zależności mają postać logicznych formuł łączących elementy. Załóżmy na przykład, że kwestionariusz zawiera pozycje i , j i k . Przykładami takich deterministycznych zależności są wtedy i → j , i ∧ j → k oraz i ∨ j → k .
Od czasu podstawowej pracy Flamenta (1976) opracowano szereg różnych metod analizy Boole'a. Patrz, na przykład, Buggenhaut i Degreef (1987), Duquenne (1987), analiza drzewa pozycji Leeuwe (1974), Schrepp (1999) lub Theuns (1998). Metody te mają wspólny cel, jakim jest wyprowadzenie deterministycznych zależności między elementami kwestionariusza na podstawie danych, ale różnią się algorytmami umożliwiającymi osiągnięcie tego celu.
Analiza boolowska to eksploracyjna metoda wykrywania deterministycznych zależności między elementami. Wykryte zależności należy potwierdzić w kolejnych badaniach. Metody analizy boolowskiej nie zakładają, że wykryte zależności opisują dane w całości. Mogą istnieć również inne zależności probabilistyczne. W związku z tym analiza boolowska próbuje wykryć interesujące deterministyczne struktury w danych, ale nie ma na celu odkrycia wszystkich aspektów strukturalnych w zestawie danych. Dlatego sensowne jest stosowanie innych metod, takich jak na przykład analiza klas utajonych , razem z analizą boolowską.
Obszary zastosowań
Badanie zależności deterministycznych ma pewne tradycje w psychologii edukacyjnej . Pozycje reprezentują w tym obszarze zwykle umiejętności lub zdolności poznawcze badanych. Bart i Airasian (1974) wykorzystują analizę Boole'a do ustalenia logicznych implikacji dla zestawu zadań Piageta . Innymi przykładami tej tradycji są hierarchie uczenia się Gagné (1968) lub teoria strukturalnego uczenia się Scandury (1971).
Istnieje kilka prób wykorzystania analizy boolowskiej, zwłaszcza analizy drzewa elementów, do konstruowania przestrzeni wiedzy z danych. Przykłady można znaleźć w Held i Korossy (1998) lub Schrepp (2002).
Metody analizy logicznej są wykorzystywane w wielu badaniach nauk społecznych w celu uzyskania wglądu w strukturę danych dychotomicznych . Bart i Krus (1973) używają na przykład analizy boolowskiej do ustalenia hierarchicznego porządku elementów, które opisują społecznie nieakceptowane zachowania. Janssens (1999) zastosował metodę analizy boolowskiej do zbadania procesu integracji mniejszości z systemem wartości dominującej kultury. Romme (1995a) wprowadził logiczną analizę porównawczą do nauk o zarządzaniu i zastosował ją w badaniu procesów samoorganizujących się w zespołach zarządzających (Romme 1995b).
Relacje z innymi dziedzinami
Analiza boolowska ma pewne powiązania z innymi obszarami badawczymi. Istnieje ścisły związek między analizą boolowską a przestrzenią wiedzy . Teoria przestrzeni wiedzy zapewnia ramy teoretyczne dla formalnego opisu wiedzy ludzkiej. Domena wiedzy jest w tym podejściu reprezentowane przez zbiór Q problemów. Znajomość podmiotu w danej dziedzinie jest następnie opisywana podzbiorem problemów z Q , które jest w stanie rozwiązać. Ten zbiór nazywany jest stanem wiedzy przedmiotu. Ze względu na zależności między przedmiotami (na przykład, jeśli rozwiązanie przedmiotu j oznacza rozwiązanie punktu i ), nie wszystkie elementy zbioru potęgi Q będą na ogół możliwymi stanami wiedzy. Zbiór wszystkich możliwych stanów wiedzy nazywany jest strukturą wiedzy . Metody analizy boolowskiej można wykorzystać do skonstruowania struktury wiedzy z danych (na przykład Theuns, 1998 lub Schrepp, 1999). Główna różnica między oboma obszarami badawczymi polega na tym, że analiza Boole'a koncentruje się na wyodrębnianiu struktur z danych, podczas gdy teoria przestrzeni wiedzy koncentruje się na strukturalnych właściwościach relacji między strukturą wiedzy a opisującymi ją wzorami logicznymi.
Ściśle związana z teorią przestrzeni wiedzy jest formalna analiza koncepcji (Ganter i Wille, 1996). Podobnie jak w teorii przestrzeni wiedzy, podejście to koncentruje się na formalnym opisie i wizualizacji istniejących zależności. Formalna analiza koncepcji oferuje bardzo efektywne sposoby konstruowania takich zależności na podstawie danych, z naciskiem na wyrażenia „jeśli-to” („ implikacje ”). Istnieje nawet metoda zwana eksploracją atrybutów , która pozwala wydobyć wszystkie implikacje z trudno dostępnych danych.
Inną pokrewną dziedziną jest eksploracja danych . Eksploracja danych zajmuje się wydobywaniem wiedzy z dużych baz danych. Kilka algorytmów eksploracji danych wyodrębnia z bazy danych zależności w postaci j → i (zwane regułami asocjacji ).
Główną różnicą między analizą boolowską a wyodrębnianiem reguł asocjacji w eksploracji danych jest interpretacja wyodrębnionych implikacji. Celem analizy logicznej jest wyodrębnienie implikacji z danych, które (z wyjątkiem losowych błędów w zachowaniu odpowiedzi) są prawdziwe dla wszystkich wierszy w zestawie danych. W przypadku aplikacji do eksploracji danych wystarczy wykryć konsekwencje, które spełniają wstępnie zdefiniowany poziom dokładności.
Na przykład w scenariuszu marketingowym interesujące jest znalezienie implikacji, które są prawdziwe dla ponad x% wierszy w zestawie danych. Księgarnia internetowa może być na przykład zainteresowana wyszukaniem implikacji formularza. Jeśli klient zamawia książkę A, zamawia również książkę B, jeśli wypełnia je więcej niż 10% dostępnych danych klienta.
Bibliografia
- Flament, C. (1976). L'analyse booleenne de questionnaire. Paryż: Mouton.
- Buggenhaut, J., & Degreef, E. (1987). O metodach dychotomizacji w analizie Boole'a kwestionariuszy. W EE Roskam & R. Suck (red.), Mathematical psychology in progress (s. 447–453). Amsterdam, NY: Holandia Północna.
- Duquenne, V. (1987). Koncepcyjne implikacje między atrybutami a niektórymi właściwościami reprezentacji dla skończonych sieci. W B. Ganter, R. Wille & KE Wolff (red.), Beiträge zur Begriffsanalyse: Vorträge der Arbeitstagung Begriffsanalyse, Darmstadt 1986 (str. 213–239). Mannheim: BI Wissenschafts-Verlag.
- Leeuwe, JFJ van (1974). Analiza drzewa pozycji. Nederlands Tijdschrift voor de Psychologie, 29, 475–484.
- Schrepp, M. (1999). O empirycznej konstrukcji implikacji dla pozycji testowych o dwóch wartościach. Journal of Mathematical Social Sciences, 38 (3), 361–375.
- Theuns, P (1998). Budowanie przestrzeni wiedzy poprzez logiczną analizę danych dotyczących współwystępowania. W CE Dowling, FS Roberts i P. Theuns (red.), Recent Progress in Mathematical Psychology (str. 173–194). Hillsdale, NJ: Erlbaum.
- Bart, WA i Airasian PW (1974). Wyznaczanie kolejności wśród siedmiu zadań piagetowskich metodą teorii uporządkowania. Journal of Educational Psychology, 66 (2), 277–284.
- Gagné, RM (1968). Hierarchie uczenia się. Psychologia edukacyjna, 6, 1–9.
- Scandura JM (1971). Teorie deterministyczne w uczeniu się strukturalnym: trzy poziomy empiryzmu. Journal of Structural Learning, 3, 21–53.
- Bart, WM i Krus, DJ (1973). Teoretyczna metoda porządkowania służąca do określania hierarchii między przedmiotami. Pomiary edukacyjne i psychologiczne, 33, 291–300.
- Janssens, R. (1999). Podejście logiczne do pomiaru procesów i postaw grupowych. Przykład integracji. Mathematical Social Sciences, 38, 275–293.
- Held, T. i Korossy, K. (1998). Analiza danych jako heurystyka do tworzenia teoretycznie ugruntowanych struktur pozycji. Zeitschrift für Psychologie, 206, 169–188.
- Ganter, B. i Wille, R. (1996). Formale Begriffsanalyse: Mathematische Grundlagen. Berlin: Springer.
- Romme, AGL (1995). Boolowska porównawcza analiza danych jakościowych. Jakość i ilość, 29, 317-329.
- Romme, AGL (1995). A Samoorganizujące się procesy w najwyższych zespołach zarządzających: logiczne podejście porównawcze. Journal of Business Research, 34, 11–34.
- Schrepp, M. (2003). Metoda analizy zależności hierarchicznych między pozycjami kwestionariusza. Metody badań psychologicznych - online, 19, 43–79.