Język ontologii sieciowej — Web Ontology Language

Język ontologii sieciowej OWL
Status Opublikowany
Rok rozpoczęty 2004
Redakcja Mike Dean ( BBN Technologies ), Guus Schreiber
Standardy podstawowe Struktura opisu zasobów , RDFS
Domena Sieć semantyczna
Skrót SOWA
Strona internetowa Odniesienie SOWA
OWL 2 Język ontologii sieciowej
Status Opublikowany
Rok rozpoczęty 2009
Redakcja Grupa Robocza W3C OWL
Standardy podstawowe Struktura opisu zasobów, RDFS
Domena Sieć semantyczna
Skrót SOWA 2
Strona internetowa Przegląd OWL 2

Język Ontologii Sieciowej ( OWL ) to rodzina reprezentacja wiedzy języków autorskich ontologii . Ontologie są formalnym sposobem opisu taksonomii i sieci klasyfikacyjnych, zasadniczo definiującym strukturę wiedzy dla różnych dziedzin: rzeczowników reprezentujących klasy przedmiotów i czasowników reprezentujących relacje między przedmiotami.

Ontologie przypominają hierarchie klas w programowaniu obiektowym, ale istnieje kilka krytycznych różnic. Hierarchie klas mają reprezentować struktury używane w kodzie źródłowym, które ewoluują dość powoli (być może z comiesięcznymi poprawkami), podczas gdy ontologie mają reprezentować informacje w Internecie i oczekuje się, że będą ewoluować prawie bez przerwy. Podobnie, ontologie są zazwyczaj znacznie bardziej elastyczne, ponieważ mają reprezentować informacje w Internecie pochodzące z różnego rodzaju heterogenicznych źródeł danych. Z drugiej strony hierarchie klas są dość statyczne i opierają się na znacznie mniej zróżnicowanych i bardziej ustrukturyzowanych źródłach danych, takich jak korporacyjne bazy danych.

Języki OWL charakteryzują się formalną semantyką . Są one oparte na standardzie XML obiektów World Wide Web Consortium (W3C) zwanym Resource Description Framework (RDF). OWL i RDF przyciągnęły znaczne zainteresowanie akademickie, medyczne i komercyjne.

W październiku 2007, nowa grupa robocza W3C została rozpoczęta, aby rozszerzyć OWL o kilka nowych funkcji, jak zaproponowano w zgłoszeniu członka OWL 1.1. W3C ogłosiło nową wersję OWL 27 października 2009. Ta nowa wersja, nazwana OWL 2, wkrótce znalazła drogę do edytorów semantycznych, takich jak Protégé i semantycznych mechanizmów wnioskowania, takich jak Pellet, RacerPro, FaCT++ i HermiT.

Rodzina OWL zawiera wiele gatunków, serializacji, składni i specyfikacji o podobnych nazwach. OWL i OWL2 są używane odpowiednio w odniesieniu do specyfikacji 2004 i 2009. Zostaną użyte pełne nazwy gatunków, w tym wersja specyfikacji (na przykład OWL2 EL). Odnosząc się bardziej ogólnie, zostanie użyta Rodzina OWL .

Historia

Wczesne języki ontologiczne

Historia rozwoju ontologicznego w filozofii i informatyce jest długa . Od lat 90. XX wieku w ramach wielu badań starano się zbadać, w jaki sposób idea reprezentacji wiedzy (KR) ze sztucznej inteligencji (AI) może być użyteczna w sieci WWW. Obejmowały one języki oparte na HTML (nazywane SHOE ), oparte na XML (nazywane XOL, później OIL ) oraz różne oparte na ramkach języki KR i podejścia do pozyskiwania wiedzy.

Języki ontologii dla sieci

W 2000 roku w Stanach Zjednoczonych DARPA rozpoczęła rozwój DAML pod kierownictwem Jamesa Hendlera . W marcu 2001 r. Wspólny Komitet UE/USA ds. Języków Znaczników Agentów zdecydował, że DAML powinien zostać połączony z OIL. Hoc Wspólna Grupa EU / US ogłoszenie Robocza ds agenta Języki znaczników zostało zwołane w celu opracowania DAML + olej jako języka ontologii sieciowej. Grupa ta była wspólnie finansowana przez DARPA (w ramach programu DAML) oraz projekt finansowania technologii społeczeństwa informacyjnego (IST) Unii Europejskiej . DAML+OIL miał być cienką warstwą ponad RDFS , z formalną semantyką opartą na logice opisu (DL).

DAML+OIL ma szczególnie duży wpływ na OWL; Projekt OWL został specjalnie oparty na DAML+OIL.

Standardy sieci semantycznej

Sieć semantyczna zapewnia wspólną strukturę, która umożliwia udostępnianie i ponowne wykorzystywanie danych w aplikacjach, przedsiębiorstwach i społecznościach.

—  Konsorcjum World Wide Web, W3C Semantic Web Activity

Schemat RDF

deklaratywny język reprezentacji, na który wpływają idee z reprezentacji wiedzy

—  Konsorcjum World Wide Web, działalność dotycząca metadanych

Pod koniec lat 90. Konsorcjum World Wide Web Consortium (W3C) Metadata Activity rozpoczęło pracę nad schematem RDF (RDFS), językiem do udostępniania słownictwa RDF . RDF stał się Rekomendacją W3C w lutym 1999, a RDFS Rekomendacją Kandydatów w marcu 2000. W lutym 2001, Aktywność Sieci Semantycznej zastąpiła Aktywność Metadanych. W 2004 roku (w ramach szerszej rewizji RDF) RDFS stał się Rekomendacją W3C. Chociaż RDFS zapewnia pewne wsparcie dla specyfikacji ontologii, potrzeba bardziej ekspresyjnego języka ontologii stała się jasna.

Grupa Robocza Ontologii Sieciowej

Od poniedziałku 31 maja nasza grupa robocza oficjalnie dobiegnie końca. Osiągnęliśmy wszystko, do czego zostaliśmy upoważnieni i uważam, że nasza praca jest doceniana.

—  James Hendler i Guus Schreiber, Grupa Robocza ds. Ontologii Sieciowej: Wnioski i przyszła praca

Konsorcjum World Wide Web (W3C) stworzyło Grupę Roboczą ds. Ontologii Sieciowej jako część swojej działalności w sieci semantycznej. Rozpoczęła pracę 1 listopada 2001 roku wraz ze współprzewodniczącymi Jamesem Hendlerem i Guusem Schreiberem. Pierwsze robocze szkice streszczenia składni , odnośników i streszczenia zostały opublikowane w lipcu 2002. OWL stał się formalnym zaleceniem W3C 10 lutego 2004, a grupa robocza została rozwiązana 31 maja 2004.

Grupa Robocza SOWA

W 2005 roku podczas warsztatów OWL Experiences And Directions osiągnięto konsensus, że ostatnie postępy w logice opisu pozwolą na bardziej ekspresyjną wersję, aby bardziej kompleksowo spełnić wymagania użytkownika, przy jednoczesnym zachowaniu dobrych właściwości obliczeniowych. W grudniu 2006 roku zgłoszenie członka OWL1.1 zostało złożone do W3C. W3C wyczarterowało Grupę Roboczą OWL jako część Aktywności Sieci Semantycznej we wrześniu 2007. W kwietniu 2008, ta grupa zdecydowała się nazwać ten nowy język OWL2, wskazując na istotną rewizję.

OWL 2 stał się rekomendacją W3C w październiku 2009. OWL 2 wprowadza profile w celu poprawy skalowalności w typowych aplikacjach.

Akronim

Dlaczego nie być niespójnym w przynajmniej jednym aspekcie języka, który polega na spójności?

—  Guus Schreiber, Dlaczego SOWA, a nie WOL?

OWL został wybrany jako łatwo wyraźnym akronimem, który uzyskując dobre logo, sugerować mądrość i cześć Williama A. Martin „s One World Język projektu reprezentacja wiedzy od 1970 roku.

Przyjęcie

W 2006 roku badanie ontologii dostępnych w sieci zebrało 688 ontologii OWL. Spośród nich 199 to OWL Lite, 149 to OWL DL i 337 OWL Full (według składni). Odkryli, że 19 ontologii ma ponad 2000 klas, a 6 ma ponad 10 000 klas. W tym samym badaniu zebrano 587 słowników RDFS.

Ontologie

Ontologia jest wyraźną specyfikacją konceptualizacji.

—  Tom Gruber , Podejście tłumaczeniowe do specyfikacji przenośnej ontologii

Dane opisane przez ontologię w rodzinie OWL są interpretowane jako zbiór "indywiduów" i zbiór "stwierdzeń własności", które wiążą te jednostki ze sobą. Ontologia składa się ze zbioru aksjomatów, które nakładają ograniczenia na zbiory indywiduów (nazywane „klasami”) i typy dozwolonych między nimi relacji. Te aksjomaty zapewniają semantykę, pozwalając systemom na wywnioskowanie dodatkowych informacji na podstawie podanych wprost danych. Pełne wprowadzenie do ekspresyjnej mocy OWL znajduje się w Przewodniku OWL W3C .

Ontologie OWL mogą importować inne ontologie, dodając informacje z importowanej ontologii do bieżącej ontologii.

Przykład

Ontologia opisująca rodziny może zawierać aksjomaty stwierdzające, że właściwość „hasMother” występuje tylko między dwiema jednostkami, gdy występuje również „hasParent” oraz że indywidua klasy „HasTypeOBlood” nigdy nie są powiązane poprzez „hasParent” z członkami „HasTypeABBlood” klasa. Jeśli zostanie stwierdzone, że dana Harriet jest powiązana przez „hasMother” z daną Sue i że Harriet należy do klasy „HasTypeOBlood”, można wywnioskować, że Sue nie jest członkiem „HasTypeABBlood”. Jest to jednak prawdziwe tylko wtedy, gdy pojęcia „rodzica” i „matki” oznaczają jedynie biologicznego rodzica lub matkę, a nie rodzica lub matkę społeczną.

Gatunek

dialekty SOWA

Poparta przez W3C specyfikacja OWL zawiera definicję trzech wariantów OWL, o różnych poziomach wyrazistości. Są to OWL Lite, OWL DL i OWL Full (uporządkowane przez zwiększenie wyrazistości). Każdy z tych podjęzyków jest rozszerzeniem składniowym swojego prostszego poprzednika. Zachodzi następujący zestaw relacji. Ich odwrotności nie.

  • Każda prawna ontologia OWL Lite jest legalną ontologią OWL DL.
  • Każda prawna ontologia OWL DL jest legalną ontologią OWL Pełna.
  • Każdy ważny wniosek OWL Lite jest prawidłowym wnioskiem OWL DL.
  • Każdy ważny wniosek OWL DL jest prawidłowym pełnym wnioskiem OWL.

SOWA Lite

OWL Lite był pierwotnie przeznaczony do wspierania tych użytkowników, którzy przede wszystkim potrzebują hierarchii klasyfikacji i prostych ograniczeń. Na przykład, chociaż obsługuje ograniczenia kardynalności , zezwala tylko na wartości kardynalności 0 lub 1. Miano nadzieję, że łatwiej będzie zapewnić obsługę narzędzi dla OWL Lite niż jego bardziej wyraziste krewne, umożliwiając szybką ścieżkę migracji dla systemów używających tezaurusów i innych taksonomie . W praktyce jednak, większość ograniczeń ekspresji nałożonych na OWL Lite jest niewiele więcej niż niedogodnościami składniowymi: większość konstrukcji dostępnych w OWL DL może być zbudowana przy użyciu złożonych kombinacji cech OWL Lite i jest równie ekspresyjna jak logika opisu . Rozwój narzędzi OWL Lite okazał się zatem prawie tak trudny jak rozwój narzędzi dla OWL DL, a OWL Lite nie jest szeroko stosowany.

SOWA DL

OWL DL jest zaprojektowany, aby zapewnić maksymalną możliwą ekspresję przy zachowaniu kompletności obliczeniowej ( zachowuje albo φ albo ¬φ), rozstrzygalności (istnieje skuteczna procedura do określenia, czy φ jest wyprowadzalne, czy nie) i dostępność praktycznych algorytmów rozumowania. OWL DL zawiera wszystkie konstrukcje języka OWL, ale mogą być używane tylko pod pewnymi ograniczeniami (na przykład ograniczenia liczbowe nie mogą być nałożone na właściwości, które są zadeklarowane jako przechodnie; i chociaż klasa może być podklasą wielu klas, klasa nie może być instancją innej klasy). OWL DL jest tak nazwany ze względu na jego zgodność z logiką opisu , dziedziną badań, która badała logikę, która stanowi formalną podstawę OWL.

SOWA Pełna

OWL Full jest oparty na innej semantyce niż OWL Lite lub OWL DL i został zaprojektowany, aby zachować pewną kompatybilność ze schematem RDF. Na przykład w OWL Full klasa może być traktowana jednocześnie jako zbiór indywiduów i jako jednostka sama w sobie; nie jest to dozwolone w OWL DL. OWL Full pozwala ontologii na rozszerzenie znaczenia predefiniowanego (RDF lub OWL) słownictwa. OWL Full jest nierozstrzygalny, więc żadne oprogramowanie do rozumowania nie jest w stanie przeprowadzić pełnego rozumowania.

Profile OWL2

W OWL 2 istnieją trzy podjęzyki języka. OWL 2 EL jest fragmentem, który ma wielomianową złożoność wnioskowania w czasie; OWL 2 QL jest zaprojektowany, aby umożliwić łatwiejszy dostęp i zapytania do danych przechowywanych w bazach danych; OWL 2 RL jest podzbiorem reguł OWL 2.

Składnia

Rodzina języków OWL obsługuje różne składnie. Przydatne jest rozróżnienie składni wysokiego poziomu mających na celu specyfikację od składni wymiany bardziej odpowiednich do ogólnego użytku.

Wysoki poziom

Są one zbliżone do struktury ontologicznej języków w rodzinie OWL.

Składnia abstrakcyjna OWL

Składnia wysokiego poziomu jest używana do określenia struktury i semantyki ontologii OWL.

Abstrakcyjna składnia OWL przedstawia ontologię jako sekwencję adnotacji , aksjomatów i faktów . Adnotacje zawierają metadane zorientowane na maszynę i człowieka. Informacje o klasach, właściwościach i indywiduach składających się na ontologię zawarte są jedynie w aksjomatach i faktach. Każda klasa, właściwość i jednostka jest anonimowa lub identyfikowana przez odwołanie URI . Fakty określają dane dotyczące osoby lub pary indywidualnych identyfikatorów (że zidentyfikowane obiekty są różne lub takie same). Aksjomaty określają cechy klas i własności. Styl ten jest podobny do języków ramek i zupełnie niepodobny do dobrze znanych składni DL i Resource Description Framework (RDF).

Sean Bechhofer i in. twierdzą, że chociaż ta składnia jest trudna do przeanalizowania, jest dość konkretna. Dochodzą do wniosku, że abstrakcyjna składnia nazwy może być nieco myląca.

Składnia funkcjonalna OWL2

Ta składnia ściśle odpowiada strukturze ontologii OWL2. Jest używany przez OWL2 do określania semantyki, mapowań do wymiany składni i profili.

Składnia wymiany

Serializacja RDF/XML OWL
XML.svg
Rozszerzenie nazwy pliku
.owx, .sowa, .rdf
Rodzaj mediów internetowych
aplikacja/sowa+xml, aplikacja/rdf+xml
Opracowany przez Konsorcjum World Wide Web
Standard Serializacja XML OWL 2 27 października 2009 ; 11 lat temu , OWL Reference 10 lutego 2004 ; 17 lat temu ( 2009-10-27 )
 ( 2004-02-10 )
Otwarty format ? tak

Składnie RDF

Mapowania składni w RDF są określone dla języków z rodziny OWL. Opracowano kilka formatów serializacji RDF . Każdy prowadzi do składni języków z rodziny OWL poprzez to odwzorowanie. RDF/XML jest normatywne.

Składnia XML OWL2

OWL2 określa serializację XML, która ściśle modeluje strukturę ontologii OWL2.

Składnia Manchesteru

Składnia Manchester jest zwartą, czytelną dla człowieka składnią o stylu zbliżonym do języków ramek. Odmiany są dostępne dla OWL i OWL2. Nie wszystkie ontologie OWL i OWL2 mogą być wyrażone w tej składni.

Przykłady

  • Język Ontologii Sieciowej W3C OWL 2 dostarcza przykładów składni.

Ontologia herbaty

Rozważ ontologię herbaty opartą na klasie herbaty. Po pierwsze, potrzebny jest identyfikator ontologii. Każda ontologia OWL musi być identyfikowana przez URI (np. http://www.example.org/tea.owl). Ten przykład przedstawia sens składni. Aby zaoszczędzić miejsce poniżej, pominięto preambuły i definicje prefiksów.

Składnia funkcjonalna OWL2
Ontology(<http://example.org/tea.owl>
  Declaration( Class( :Tea ) )
)
Składnia XML OWL2
 <Ontology ontologyIRI="http://example.org/tea.owl" ...>
   <Prefix name="owl" IRI="http://www.w3.org/2002/07/owl#"/>
   <Declaration>
     <Class IRI="Tea"/>
   </Declaration>
 </Ontology>
Składnia Manchesteru
Ontology: <http://example.org/tea.owl>
Class: Tea
Składnia RDF/XML
<rdf:RDF ...>
    <owl:Ontology rdf:about=""/>
    <owl:Class rdf:about="#Tea"/>
</rdf:RDF>
RDF/ Żółw
 <http://example.org/tea.owl> rdf:type owl:Ontology .
 :Tea  rdf:type            owl:Class .

Semantyka

Związek z logiką opisu

Klasy OWL odpowiadają pojęciom logiki opisu (DL) , właściwości OWL do ról DL , podczas gdy indywidua są nazywane w ten sam sposób zarówno w terminologii OWL, jak i DL.

Na początku IS-A było dość proste. Dziś jednak istnieje prawie tyle znaczeń tego ogniwa dziedziczenia, ile jest systemów reprezentacji wiedzy.

—  Ronald J. Brachman , Czym jest, a czym nie jest

Wczesne próby budowania dużych ontologii były nękane brakiem jasnych definicji. Członkowie rodziny OWL mają modelową teoretyczną semantykę formalną, a więc mają silne podstawy logiczne .

Logiki opisowe to rodzina logik, które są rozstrzygalnymi fragmentami logiki pierwszego rzędu o atrakcyjnych i dobrze zrozumianych właściwościach obliczeniowych. Semantyka OWL DL i OWL Lite jest oparta na DL. Łączą składnię do opisywania i wymiany ontologii oraz formalną semantykę, która nadaje im znaczenie. Na przykład OWL DL odpowiada logice opisu, podczas gdy OWL 2 odpowiada logice. Dla tych DL istnieją zdrowe , kompletne, kończące rozumowania (tj. systemy, które gwarantują, że wyprowadzą każdą konsekwencję wiedzy w ontologii).

Stosunek do RDFS

OWL Full ma być kompatybilny ze schematem RDF (RDFS) i być zdolnym do rozszerzania znaczeń istniejącego słownictwa Ramy Opisu Zasobów (RDF). Teoria Model opisuje formalne semantykę dla RDF. Ta interpretacja dostarcza znaczenia słownictwa RDF i RDFS. Zatem znaczenie ontologii OWL Full jest zdefiniowane przez rozszerzenie znaczenia RDFS, a OWL Full jest semantycznym rozszerzeniem RDF.

Założenie otwartego świata

Założenie [zamkniętego] świata implikuje, że wszystko, czego nie wiemy, jest fałszywe , podczas gdy założenie otwartego świata mówi, że wszystko, czego nie wiemy, jest niezdefiniowane .

—  Stefano Mazzocchi, Zamknięty świat kontra otwarty świat: pierwsza bitwa w sieci semantycznej

Języki z rodziny OWL wykorzystują założenie otwartego świata . Przy założeniu otwartego świata, jeśli nie można udowodnić, że twierdzenie jest prawdziwe przy obecnej wiedzy, nie możemy wyciągnąć wniosku, że twierdzenie to jest fałszywe.

Kontrast z innymi językami

Relacyjna baza danych składa się z zestawów krotek z tymi samymi atrybutami . SQL to język zapytań i zarządzania dla relacyjnych baz danych. Prolog to logiczny język programowania . Obaj stosują założenie zamkniętego świata .

Terminologia

Języki z rodziny OWL są zdolne do tworzenia klas, właściwości, definiowania instancji i ich operacji.

Instancje

Przykład jest obiektem. Odpowiada jednostce logiki opisu .

Klasy

Klasa jest zbiorem obiektów. Klasa może zawierać osoby, instancje klasy. Klasa może mieć dowolną liczbę wystąpień. Instancja może należeć do żadnej, do jednej lub kilku klas.

Klasa może być podklasą innej, dziedzicząc cechy z nadrzędnej nadklasy . Odpowiada logicznego subsumcji i DL koncepcji włączenia zanotowana .

Wszystkie klasy są podklasami owl:Thing ( zapis DL od góry ), klasy głównej .

Wszystkie zajęcia prowadzone są przez podklasy owl: Nothing (DL dolny zanotowana ), z pustej klasy. Żadne instancje nie są członkami owl:Nothing. Modelarze używają owl:Thing i owl:Nothing, aby potwierdzić fakty dotyczące wszystkich instancji lub ich braku.

Klasa i jej członkowie mogą być zdefiniowani w OWL albo przez rozszerzenie albo przez intencję . Jednostka może być jawnie przypisana do klasy przez asercję Class , na przykład możemy dodać stwierdzenie Queen elizabeth is a(n instance of) human , lub przez wyrażenie klasy z wyrażeniami ClassExpression dla każdej instancji klasy ludzkiej, która ma wartość żeńską do własności płci jest instancją klasy kobieta .

Przykład

Nazwijmy ludzi klasą wszystkich ludzi na świecie jest podklasą sowa:rzecz. Klasa wszystkich kobiet (powiedzmy kobiet ) na świecie jest podklasą ludzi . Potem będzie

Można zauważyć przynależność jakiejś osoby do klasy

ClassAssertion( human George_Washington )

i włączenie do klasy

SubClassOf( woman human ) 

Pierwsza oznacza „George Washington jest człowiekiem”, a druga „każda kobieta jest człowiekiem”.

Nieruchomości

Właściwość jest cechą charakterystyczną klasy - ukierunkowaną relacją binarną, która określa pewien atrybut, który jest prawdziwy dla instancji tej klasy. Właściwości czasami działają jako wartości danych lub łącza do innych instancji. Właściwości mogą wykazywać cechy logiczne, na przykład jako przechodnie, symetryczne, odwrotne i funkcjonalne. Właściwości mogą również mieć domeny i zakresy.

Właściwości typu danych

Właściwości typu danych to relacje między instancjami klas i literałami RDF lub typami danych schematu XML. Na przykład modelName (typ danych String) jest właściwością klasy Producent. Są one formułowane przy użyciu typu owl:DatatypeProperty .

Właściwości obiektu

Właściwości obiektu to relacje między instancjami dwóch klas. Na przykład ownedBy może być właściwością typu obiektu klasy Vehicle i może mieć zakres będący klasą Person. Są one formułowane za pomocą owl:ObjectProperty .

Operatorzy

Języki w rodzinie OWL wspierają różne operacje na klasach, takich jak związek , przecięcie i dopełnienie . Pozwalają również na wyliczenie klas, kardynalność , rozłączność i równoważność .

Metaklasy

Metaklasy to klasy klas. Są one dozwolone w OWL-ach pełnych lub z cechą zwaną kalkulacją klas/instancji.

Ontologie publiczne

Biblioteki

Biomedyczne

Normy

Przeglądarki

Następujące narzędzia obejmują publiczne przeglądarki ontologii:

Szukaj

Ograniczenia

  • Brak bezpośredniego wsparcia językowego dla relacji n-argumentowych. Na przykład, modelarze mogą chcieć opisać cechy relacji, powiązać więcej niż 2 osoby lub powiązać osobę z listą. Nie można tego zrobić w ramach OWL. Być może będą musieli zamiast tego przyjąć wzorzec, który koduje znaczenie poza formalną semantyką.

Zobacz też

Bibliografia

Dalsza lektura