Leksykalne podstawienia - Lexical substitution
Leksykalne podstawienie Zadaniem identyfikacji zastąpić słowo w kontekście punktu. Na przykład, biorąc pod uwagę następujący tekst: „Po meczu , wymienić wszystkie pozostałe deficyt płynów, aby zapobiec odwodnieniu przewlekłe całym turnieju” substytutem grze może być podana.
Leksykalny podstawienie jest ściśle związane z dezambiguacji sens wyrazu (WSD), że obie mają na celu określenie znaczenia wyrazu. Jednakże, podczas gdy WSD składa się automatycznie przypisując odpowiedni sens od stałej inwentaryzacji sensie, leksykalne substytucja nie nakłada żadnych ograniczeń na której substytutem wyboru jak najlepszego przedstawiciela tego słowa w kontekście. Przez nie zalecania inwentaryzacji, leksykalne podstawienie rozwiązuje kwestię ziarnistości wyróżnień zmysłowych i zapewnia równe warunki dla automatycznych systemów, które automatycznie uzyskują sens wyrazu (a zadanie dalej Worda Sense Induction ).
Ocena
W celu oceny systemów automatycznych na leksykalnym substytucji, zadanie zostało zorganizowane w Semeval-2007 konkursu oceniającego, która odbyła się w Pradze w 2007. Semeval-2010 zadania na cross-językowej substytucji leksykalnym również miała miejsce.
Skip-gram modelu
Model pominięcia gramów wykonuje rozmowę z podobnym znaczeniu pod przestrzeni wektorowej (zbiór obiektów, które mogą być dodawane razem, pomnożonej przez numery), które znajdują się blisko siebie w N wymiarach (wykaz elementów). Różnorodność sieci neuronowe (komputerowym wzorowane ludzkiego mózgu) są uformowane razem jako wyniku wektory i sieci, które są związane ze sobą. To wszystko odbywa się w wymiarach słownictwa, które zostały wygenerowane w sieci. Model ten jest stosowany w algorytmach automatyki substytucja i predykcji słownikowych. Jeden taki algorytm opracowany przez Oren Melamuda Omer Levy i Ido Dagan wykorzystuje model Skip-gramową znaleźć wektor dla każdego słowa i jego synonimy. Następnie oblicza odległość między wektorami cosinus aby określić, które słowa będą najlepsze zamienniki.
Przykład
W zdaniu jak „Pies wszedł w szybkim tempie” każde słowo ma konkretnego wektora w stosunku do drugiego. Wektor dla „The” byłoby [1,0,0,0,0,0,0], ponieważ 1 jest słownictwo słowo i 0s są słowa otaczające że słownictwo, które tworzą wektor.
Zobacz też
Bibliografia
- McCarthy D. R. Navigli. Anglicy leksykalna Zmiana zadań . Zasobów językowych i ewaluacji , 43 (2), Springer, 2009, ss. 139-159.
- McCarthy D. R. Navigli. SemEval-2007 Zadanie 10: English leksykalna Zmiana zadań . Proc. z Semeval-2007 Workshop (SEMEVAL) , w 45. dorocznym spotkaniu Association for Computational Linguistics (ACL 2007), Praga, Republika Czeska, 23-24 czerwca 2007, ss. 48-53.
- D. McCarthy. Leksykalny podstawienie jako zadanie do oceny WSD . W postępowaniu warsztatu ACL na sens wyrazu dezambiguacji: Nowy sukcesów i przyszłych kierunkach, Filadelfia, USA, 2002, pp 109-115..
- R. Navigli. Słowo Sense Ujednoznacznienia: Survey , Przeglądy ACM Computing, 41 (2), 2009, str 1-69..
Referencje
Ten językoznawstwo obliczeniowe związane z modelem artykuł jest en . Można źródło Wikipedia rozszerza ją . |