Rozumowanie zdroworozsądkowe - Commonsense reasoning

W przypadku sztucznej inteligencji (AI) zdroworozsądkowe rozumowanie jest podobną do ludzkiej zdolnością do zakładania rodzaju i istoty zwykłych sytuacji, z którymi stykają się ludzie na co dzień. Założenia te obejmują osądy dotyczące natury obiektów fizycznych, właściwości taksonomicznych i intencji ludzi. Urządzenie, które wykazuje zdroworozsądkowe rozumowanie, może być zdolne do wyciągania wniosków podobnych do ludzkiej psychologii ludowej (wrodzona zdolność człowieka do rozumowania o ludzkich zachowaniach i intencjach) oraz naiwnej fizyki (naturalne rozumienie świata fizycznego przez ludzi).

Definicje i charakterystyki

Niektóre definicje i charakterystyki zdrowego rozsądku od różnych autorów obejmują:

  • „Wiedza zdroworozsądkowa obejmuje podstawowe fakty o zdarzeniach (w tym działaniach) i ich skutkach, fakty o wiedzy i sposobie jej zdobywania, fakty o wierzeniach i pragnieniach. Obejmuje również podstawowe fakty dotyczące przedmiotów materialnych i ich właściwości”.
  • „Wiedza zdroworozsądkowa różni się od wiedzy encyklopedycznej tym, że zajmuje się wiedzą ogólną, a nie szczegółami konkretnych bytów”.
  • Wiedza zdroworozsądkowa to „wiedza ze świata rzeczywistego, która może stanowić podstawę do automatycznego gromadzenia i interpretacji dodatkowej wiedzy”.
  • Świat zdrowego rozsądku składa się z „czasu, przestrzeni, interakcji fizycznych, ludzi i tak dalej”.
  • Zdrowy rozsądek to „cała wiedza o świecie, którą przyjmujemy za pewnik, ale rzadko mówimy głośno”.
  • Zdrowy rozsądek to „wiedza, którą można wielokrotnie wykorzystywać, która nie jest specyficzna dla konkretnego obszaru tematycznego… wiedza, którą powinieneś mieć”.

Profesor NYU Ernest Davis charakteryzuje wiedzę zdroworozsądkową jako „co typowy siedmiolatek wie o świecie”, w tym przedmioty fizyczne, substancje, rośliny, zwierzęta i społeczeństwo ludzkie. Zwykle wyklucza naukę książek, wiedzę specjalistyczną i znajomość konwencji; ale czasami zawiera wiedzę na te tematy. Na przykład umiejętność gry w karty jest wiedzą specjalistyczną, a nie „wiedzą zdroworozsądkową”; ale świadomość, że ludzie grają w karty dla zabawy, liczy się jako „wiedza zdroworozsądkowa”.

Problem zdroworozsądkowego rozumowania

System autonomicznego samochodu może wykorzystywać sieć neuronową w celu określenia, które części obrazu wydają się pasować do poprzednich obrazów szkoleniowych pieszych, a następnie modelować te obszary jako wolno poruszające się, ale nieco nieprzewidywalne prostokątne pryzmaty, których należy unikać.

W porównaniu z ludźmi, istniejąca sztuczna inteligencja nie ma kilku cech ludzkiego zdroworozsądkowego rozumowania; przede wszystkim ludzie mają potężne mechanizmy wnioskowania o „ naiwnej fizyce ”, takie jak przestrzeń, czas i interakcje fizyczne. Dzięki temu nawet małe dzieci mogą z łatwością wyciągać wnioski typu „Jeśli zrzucę ten długopis ze stołu, spadnie on na podłogę”. Ludzie mają również potężny mechanizm „ psychologii ludowej ”, który pomaga im interpretować zdania w języku naturalnym, takie jak „Radowie miejscy odmówili demonstrantom pozwolenia, ponieważ opowiadali się za przemocą”. (Ogólna sztuczna inteligencja ma trudności z rozróżnieniem, czy ci, którzy rzekomo opowiadają się za przemocą, to radni czy demonstranci.) Ten brak „powszechnej wiedzy” oznacza, że ​​sztuczna inteligencja często popełnia inne błędy niż ludzie, w sposób, który może wydawać się niezrozumiały. Na przykład, istniejące samochody autonomiczne nie mogą rozumować o lokalizacji ani intencjach pieszych dokładnie tak, jak robią to ludzie, i zamiast tego muszą używać nieludzkich sposobów rozumowania, aby uniknąć wypadków.

Nakładające się na siebie podtematy rozumowania zdroworozsądkowego obejmują ilości i miary, czas i przestrzeń, fizykę, umysły, społeczeństwo, plany i cele oraz działania i zmiany.

Problem z wiedzą zdroworozsądkową

Problem wiedzy zdroworozsądkowej to aktualny projekt w sferze sztucznej inteligencji, mający na celu stworzenie bazy danych zawierającej ogólną wiedzę, jakiej oczekuje się od większości osób, reprezentowaną w przystępny sposób programom sztucznej inteligencji posługującym się językiem naturalnym. Ze względu na szeroki zakres wiedzy zdroworozsądkowej zagadnienie to uznawane jest za jeden z najtrudniejszych problemów w badaniach nad sztuczną inteligencją. Aby jakiekolwiek zadanie zostało wykonane tak, jak poradziłby sobie z nim ludzki umysł, maszyna musi wyglądać tak inteligentnie jak człowiek. Zadania takie obejmują rozpoznawanie obiektów , tłumaczenie maszynowe i eksplorację tekstu . Aby je wykonać, maszyna musi być świadoma tych samych pojęć, które rozpoznaje osoba posiadająca wiedzę zdroworozsądkową.

Zdrowy rozsądek w inteligentnych zadaniach

W 1961 roku Bar Hillel po raz pierwszy omówił potrzebę i znaczenie wiedzy praktycznej dla przetwarzania języka naturalnego w kontekście tłumaczenia maszynowego. Niektóre niejasności są rozwiązywane za pomocą prostych i łatwych do przyswojenia reguł. Inne wymagają szerokiego poznania otaczającego świata, a więc większej wiedzy zdroworozsądkowej. Na przykład, gdy maszyna jest używana do tłumaczenia tekstu, pojawiają się problemy niejednoznaczności, które można łatwo rozwiązać poprzez osiągnięcie konkretnego i prawdziwego zrozumienia kontekstu. Tłumacze online często rozwiązują niejasności za pomocą analogicznych lub podobnych słów. Np. tłumacząc na niemiecki zdania "elektryk pracuje" i "telefon działa" maszyna tłumaczy poprawnie "pracuje" na "pracuje" w pierwszym i jako "prawidłowo działa" w drugim. jeden. Maszyna widziała i czytała w tekście, że niemieckie słowa oznaczające „robotnik” i „elektryk” są często używane razem i znajdują się blisko siebie. To samo dotyczy „telefonu” i „prawidłowego działania”. Jednak proxy statystyczne, które działa w prostych przypadkach, często zawodzi w skomplikowanych. Istniejące programy komputerowe wykonują proste zadania językowe, manipulując krótkimi frazami lub oddzielnymi słowami, ale nie próbują głębszego zrozumienia i skupiają się na krótkoterminowych wynikach.

Wizja komputerowa

Tego rodzaju problemy pojawiają się w wizji komputerowej. Na przykład, patrząc na fotografię łazienki, niektóre przedmioty, które są małe i tylko częściowo widoczne, takie jak ściereczki do twarzy i butelki, są rozpoznawalne dzięki otaczającym obiektom (toaleta, umywalka, wanna), które sugerują przeznaczenie pomieszczenia. Na odosobnionym obrazie byłyby trudne do zidentyfikowania. Filmy okazują się jeszcze trudniejszymi zadaniami. Niektóre filmy zawierają sceny i momenty, których nie można zrozumieć, po prostu dopasowując zapamiętane szablony do obrazów. Na przykład, aby zrozumieć kontekst filmu, widz musi wyciągać wnioski na temat intencji bohaterów i czynić przypuszczenia w zależności od ich zachowania. We współczesnym stanie techniki nie da się zbudować i zarządzać programem, który będzie wykonywał takie zadania jak wnioskowanie, czyli przewidywanie działań postaci. Najwięcej, co można zrobić, to zidentyfikować podstawowe działania i śledzić postacie.

Manipulacja robotami

Oczywista jest potrzeba i znaczenie zdroworozsądkowego rozumowania w autonomicznych robotach, które pracują w rzeczywistym, niekontrolowanym środowisku. Na przykład, jeśli robot jest zaprogramowany do wykonywania zadań kelnera na koktajlu i widzi, że podniesiona przez niego szklanka jest stłuczona, kelner-robot nie powinien wlewać płynu do szklanki, ale raczej ją podnieść. inny. Takie zadania wydają się oczywiste, gdy dana osoba ma proste, zdroworozsądkowe rozumowanie, ale zapewnienie, że robot uniknie takich błędów, jest wyzwaniem.

Sukcesy w automatycznym rozumowaniu zdroworozsądkowym

Znaczący postęp w dziedzinie zautomatyzowanego rozumowania zdroworozsądkowego dokonuje się w obszarach rozumowania taksonomicznego, rozumowania działań i zmian, wnioskowania o czasie. Każda z tych sfer ma dobrze uznaną teorię dla szerokiego zakresu zdroworozsądkowych wniosków.

Rozumowanie taksonomiczne

Taksonomia to zbiór jednostek i kategorii oraz ich relacji. Trzy podstawowe relacje to:

  • Jednostka jest instancją kategorii. Na przykład pojedynczy Tweety jest instancją kategorii robin .
  • Jedna kategoria jest podzbiorem innej. Na przykład rudzik jest podzbiorem ptaka .
  • Dwie kategorie są rozłączne. Na przykład rudzik jest oddzielony od pingwina .

Przechodniość to jeden z rodzajów wnioskowania w taksonomii. Ponieważ Tweety jest instancją rudzika, a rudzik jest podzbiorem ptaka , wynika z tego, że Tweety jest instancją ptaka . Dziedziczenie to inny rodzaj wnioskowania. Ponieważ Tweety jest instancją rudzika , który jest podzbiorem ptaka , a ptak jest oznaczony właściwością canfly , wynika z tego , że Tweety i rudzik mają właściwość canfly . Kiedy dana osoba dokonuje taksonomii bardziej abstrakcyjnych kategorii, zarysowanie i odgraniczenie konkretnych kategorii staje się bardziej problematyczne. Proste struktury taksonomiczne są często używane w programach AI. Na przykład WordNet to zasób zawierający taksonomię, której elementami są znaczenia angielskich słów. Systemy eksploracji sieci wykorzystywane do zbierania zdroworozsądkowej wiedzy z dokumentów internetowych skupiają się na relacjach taksonomicznych, aw szczególności na zbieraniu relacji taksonomicznych.

Akcja i zmiana

Teoria działania, wydarzeń i zmiany to kolejny zakres zdroworozsądkowego rozumowania. Istnieją ustalone metody wnioskowania dla dziedzin, które spełniają poniższe ograniczenia:

  • Zdarzenia są niepodzielne, co oznacza, że ​​jedno zdarzenie występuje na raz, a rozumujący musi wziąć pod uwagę stan i kondycję świata na początku i na końcu konkretnego zdarzenia, ale nie w trakcie stanów, podczas gdy nadal istnieją dowody na to, że - zachodzące zmiany (postęp).
  • Każda zmiana jest wynikiem jakiegoś zdarzenia
  • Zdarzenia są deterministyczne, co oznacza, że ​​stan świata na końcu zdarzenia jest określony przez stan świata na początku i specyfikację zdarzenia.
  • Jest jeden aktor i wszystkie wydarzenia są jego działaniami.
  • Odnośny stan świata na początku jest albo znany, albo można go obliczyć.

Rozumowanie temporalne

Rozumowanie temporalne to zdolność do zakładania założeń dotyczących wiedzy ludzi na temat czasów, czasów trwania i przedziałów czasowych. Na przykład, jeśli dana osoba wie, że Mozart urodził się po Hadynie i umarł wcześniej niż on, może wykorzystać swoją wiedzę o rozumowaniu temporalnym, aby wywnioskować, że Mozart zmarł młodsze niż Hadyn. Zaangażowane wnioski sprowadzają się do rozwiązywania systemów nierówności liniowych. Zintegrowanie tego rodzaju rozumowania z konkretnymi celami, takimi jak interpretacja języka naturalnego , jest trudniejsze, ponieważ wyrażenia w języku naturalnym mają interpretację zależną od kontekstu. Proste zadania, takie jak przypisywanie znaczników czasu do procedur, nie mogą być wykonywane z całkowitą dokładnością.

Rozumowanie jakościowe

Rozumowanie jakościowe jest formą rozumowania zdroworozsądkowego analizowanego z pewnym powodzeniem. Dotyczy kierunku zmian powiązanych ze sobą wielkości. Na przykład, jeśli cena akcji wzrośnie, ilość akcji, które zostaną sprzedane, spadnie. Jeśli jakiś ekosystem zawiera wilki i jagnięta, a liczba wilków spada, śmiertelność jagniąt również się zmniejszy. Teoria ta została po raz pierwszy sformułowana przez Johana de Kleera, który analizował obiekt poruszający się na kolejce górskiej. Teoria rozumowania jakościowego znajduje zastosowanie w wielu dziedzinach, takich jak fizyka, biologia, inżynieria, ekologia itp. Stanowi podstawę wielu programów praktycznych, mapowania analogowego, rozumienia tekstu.

Wyzwania w automatyzacji zdroworozsądkowego rozumowania

Od 2014 r. istnieją pewne systemy komercyjne, które próbują wykorzystać zdroworozsądkowe rozumowanie. Używają jednak informacji statystycznych jako zastępstwa dla wiedzy zdroworozsądkowej, w której brak jest rozumowania. Obecne programy manipulują pojedynczymi słowami, ale nie próbują ani nie oferują dalszego zrozumienia. Według Ernesta Davisa i Gary'ego Marcusa pięć głównych przeszkód przeszkadza w tworzeniu zadowalającego „zdroworozsądkowego rozumowania”.

  • Po pierwsze, niektóre dziedziny zaangażowane w rozumowanie zdroworozsądkowe są tylko częściowo rozumiane. Jednostki są dalekie od pełnego zrozumienia domen, takich jak komunikacja i wiedza, interakcje międzyludzkie czy procesy fizyczne.
  • Po drugie, sytuacje, które wydają się łatwe do przewidzenia lub założenia, mogą mieć logiczną złożoność, której nie obejmuje zdroworozsądkowa wiedza ludzi. Niektóre aspekty podobnych sytuacji są badane i dobrze rozumiane, ale istnieje wiele relacji, które są nieznane, nawet co do zasady i jak mogłyby być reprezentowane w formie, która jest użyteczna przez komputery.
  • Po trzecie, zdroworozsądkowe rozumowanie obejmuje wiarygodne rozumowanie. Wymaga dojścia do rozsądnego wniosku, biorąc pod uwagę to, co już wiadomo. Wnioskowanie wiarygodne było badane od wielu lat i powstało wiele teorii, które obejmują rozumowanie probabilistyczne i logikę niemonotoniczną . Przybiera różne formy, w tym wykorzystywanie nierzetelnych danych i reguł, których wnioski czasami nie są pewne.
  • Po czwarte, istnieje wiele dziedzin, w których niewielka liczba przykładów jest niezwykle częsta, podczas gdy istnieje ogromna liczba bardzo rzadkich przykładów.
  • Po piąte, formułując domniemania, trudno jest dostrzec i określić poziom abstrakcji.

W porównaniu z ludźmi, od 2018 r. istniejące programy komputerowe radzą sobie wyjątkowo słabo w nowoczesnych testach porównawczych „zdroworozsądkowego rozumowania”, takich jak Winograd Schema Challenge . Problem osiągnięcia kompetencji na poziomie człowieka w zadaniach „wiedzy zdroworozsądkowej” jest prawdopodobnie uważany za „ kompletną sztuczną inteligencję ” (to znaczy, że rozwiązanie go wymagałoby umiejętności syntezy inteligencji na poziomie człowieka ). Niektórzy badacze uważają, że nadzorowane dane uczenia się są niewystarczające, aby wytworzyć sztuczną ogólną inteligencję zdolną do zdroworozsądkowego rozumowania, dlatego zwrócili się do mniej nadzorowanych technik uczenia się.

Podejścia i techniki

Studium rozumowania Commonsense jest podzielone na podejścia oparte na wiedzy i podejścia, które opierają się na uczeniu maszynowym i wykorzystaniu dużych korpusów danych z ograniczonymi interakcjami między tymi dwoma rodzajami podejść. Istnieją również podejścia crowdsourcingowe, próbujące zbudować bazę wiedzy poprzez powiązanie wiedzy zbiorowej z wkładem osób niebędących ekspertami. Podejścia oparte na wiedzy można podzielić na podejścia oparte na logice matematycznej.

W podejściach opartych na wiedzy eksperci analizują cechy wniosków, które są wymagane do wnioskowania w określonym obszarze lub dla określonego zadania. Podejścia oparte na wiedzy składają się z podejść ugruntowanych matematycznie, nieformalnych podejść opartych na wiedzy i podejść na dużą skalę. Matematycznie ugruntowane podejścia są czysto teoretyczne, a rezultatem jest drukowany papier zamiast programu. Praca ogranicza się do zakresu dziedzin i technik rozumowania, które są przedmiotem refleksji. W nieformalnych podejściach opartych na wiedzy teorie rozumowania opierają się na anegdotycznych danych i intuicji, które wynikają z empirycznej psychologii behawioralnej. Nieformalne podejścia są powszechne w programowaniu komputerowym. Dwie inne popularne techniki wydobywania zdroworozsądkowej wiedzy z dokumentów sieci Web obejmują eksplorację sieci Web i Crowd sourcing .

COMET (2019), który wykorzystuje zarówno architekturę modelu języka OpenAI GPT, jak i istniejące zdroworozsądkowe bazy wiedzy, takie jak ConceptNet , twierdzi, że generuje zdroworozsądkowe wnioski na poziomie zbliżonym do ludzkich wzorców. Podobnie jak wiele innych obecnych wysiłków, COMET nadmiernie opiera się na wzorcach językowych powierzchni i ocenia się, że nie ma głębokiego zrozumienia wielu pojęć zdroworozsądkowych na poziomie ludzkim. Inne podejścia oparte na modelu językowym obejmują szkolenie w zakresie scen wizualnych, a nie tylko tekstu, oraz szkolenie w zakresie tekstowych opisów scenariuszy obejmujących fizykę zdroworozsądkową.

Bibliografia

Zewnętrzne linki