BabelNet - BabelNet
Wersja stabilna | BabelNet 5.0 / luty 2021 |
---|---|
System operacyjny | |
Rodzaj | |
Licencja | Attribution-NonCommercial-ShareAlike 3.0 Unported |
Stronie internetowej | babenet |
BabelNet to wielojęzyczna, zleksykalizowana sieć semantyczna i ontologia opracowana w grupie NLP Uniwersytetu Sapienza w Rzymie . BabelNet został automatycznie utworzony przez połączenie Wikipedię do najpopularniejszego obliczeniowej leksykonu w języku angielskim , WordNet . Integracja odbywa się za pomocą automatycznego mapowania i wypełniania luk leksykalnych w językach ubogich w zasoby za pomocą statystycznego tłumaczenia maszynowego . Rezultatem jest słownik encyklopedyczny, który dostarcza pojęć i nazwanych bytów zleksykalizowanych w wielu językach i związanych z dużą ilością relacji semantycznych . Dodatkowe lexicalizations i definicje są dodawane przez linkami do wordnets wolnej licencji, omegawiki, angielskiej Wikipedii , wikidane , FrameNet , VerbNet i inni. Podobnie jak WordNet, BabelNet grupuje słowa w różnych językach w zestawy synonimów , zwane synsetami Babel . Dla każdego synsetu Babel, BabelNet dostarcza krótkie definicje (zwane glosses ) w wielu językach, zebrane zarówno z WordNet, jak i Wikipedii.
Statystyki BabelNet
Od kwietnia 2021 BabelNet (wersja 5.0) obejmuje 500 języków . Zawiera prawie 20 milionów synsetów i około 1,4 miliarda sensów wyrazów (niezależnie od ich języka). Każdy synset Babel zawiera 2 synonimy na język, tj. średnio znaczenie słów. Sieć semantyczna obejmuje wszystkie LEXICO-semantyczne relacje z WordNet ( hypernymy i hiponimia , meronimia i holonim , antonimia i synonimii itd łączną kwotę około 364.000 krawędzie powiązania) jak również underspecified pokrewieństwa związku z Wikipedii (na łączną kwotę około 1,3 mld krawędzie) . Wersja 5.0 łączy również około 51 milionów obrazów z synsetami Babel i zapewnia kodowanie Lemon RDF zasobu, dostępne za pośrednictwem punktu końcowego SPARQL . 2,67 miliona synsetów ma przypisane etykiety domeny.
Aplikacje
Wykazano, że BabelNet umożliwia wielojęzyczne aplikacje przetwarzania języka naturalnego . Wykazano, że zleksykalizowana wiedza dostępna w BabelNet pozwala uzyskać najnowocześniejsze wyniki w zakresie:
- pokrewieństwo semantyczne
- wielojęzyczne ujednoznacznienie sensu słów
- wielojęzyczna dezambiguacja w sensie Word Sense i powiązanie jednostek z systemem Babelfy
- gry wideo z celem
Nagrody i podziękowania
BabelNet otrzymał nagrodę META 2015 za „przełomową pracę w pokonywaniu barier językowych poprzez wielojęzyczną zleksykalizowaną sieć semantyczną i ontologię wykorzystującą heterogeniczne źródła danych”.
BabelNet wyróżnił się w artykule w czasopiśmie Time o nowej erze innowacyjnych i aktualnych zasobów wiedzy leksykalnej dostępnych w Internecie.