BabelNet - BabelNet

BabelNet
Logo serwisu BabelNet
Wersja stabilna
BabelNet 5.0 / luty 2021
System operacyjny
Rodzaj
Licencja Attribution-NonCommercial-ShareAlike 3.0 Unported
Stronie internetowej babenet .org

BabelNet to wielojęzyczna, zleksykalizowana sieć semantyczna i ontologia opracowana w grupie NLP Uniwersytetu Sapienza w Rzymie . BabelNet został automatycznie utworzony przez połączenie Wikipedię do najpopularniejszego obliczeniowej leksykonu w języku angielskim , WordNet . Integracja odbywa się za pomocą automatycznego mapowania i wypełniania luk leksykalnych w językach ubogich w zasoby za pomocą statystycznego tłumaczenia maszynowego . Rezultatem jest słownik encyklopedyczny, który dostarcza pojęć i nazwanych bytów zleksykalizowanych w wielu językach i związanych z dużą ilością relacji semantycznych . Dodatkowe lexicalizations i definicje są dodawane przez linkami do wordnets wolnej licencji, omegawiki, angielskiej Wikipedii , wikidane , FrameNet , VerbNet i inni. Podobnie jak WordNet, BabelNet grupuje słowa w różnych językach w zestawy synonimów , zwane synsetami Babel . Dla każdego synsetu Babel, BabelNet dostarcza krótkie definicje (zwane glosses ) w wielu językach, zebrane zarówno z WordNet, jak i Wikipedii.

BabelNet to wielojęzyczna sieć semantyczna uzyskana jako integracja WordNet i Wikipedii.

Statystyki BabelNet

Od kwietnia 2021 BabelNet (wersja 5.0) obejmuje 500 języków . Zawiera prawie 20 milionów synsetów i około 1,4 miliarda sensów wyrazów (niezależnie od ich języka). Każdy synset Babel zawiera 2 synonimy na język, tj. średnio znaczenie słów. Sieć semantyczna obejmuje wszystkie LEXICO-semantyczne relacje z WordNet ( hypernymy i hiponimia , meronimia i holonim , antonimia i synonimii itd łączną kwotę około 364.000 krawędzie powiązania) jak również underspecified pokrewieństwa związku z Wikipedii (na łączną kwotę około 1,3 mld krawędzie) . Wersja 5.0 łączy również około 51 milionów obrazów z synsetami Babel i zapewnia kodowanie Lemon RDF zasobu, dostępne za pośrednictwem punktu końcowego SPARQL . 2,67 miliona synsetów ma przypisane etykiety domeny.

Aplikacje

Wykazano, że BabelNet umożliwia wielojęzyczne aplikacje przetwarzania języka naturalnego . Wykazano, że zleksykalizowana wiedza dostępna w BabelNet pozwala uzyskać najnowocześniejsze wyniki w zakresie:

Nagrody i podziękowania

BabelNet otrzymał nagrodę META 2015 za „przełomową pracę w pokonywaniu barier językowych poprzez wielojęzyczną zleksykalizowaną sieć semantyczną i ontologię wykorzystującą heterogeniczne źródła danych”.

BabelNet wyróżnił się w artykule w czasopiśmie Time o nowej erze innowacyjnych i aktualnych zasobów wiedzy leksykalnej dostępnych w Internecie.

Zobacz też

Bibliografia

Linki zewnętrzne