Leksykalne podstawienia - Lexical substitution

Leksykalne podstawienie Zadaniem identyfikacji zastąpić słowo w kontekście punktu. Na przykład, biorąc pod uwagę następujący tekst: „Po meczu , wymienić wszystkie pozostałe deficyt płynów, aby zapobiec odwodnieniu przewlekłe całym turnieju” substytutem grze może być podana.

Leksykalny podstawienie jest ściśle związane z dezambiguacji sens wyrazu (WSD), że obie mają na celu określenie znaczenia wyrazu. Jednakże, podczas gdy WSD składa się automatycznie przypisując odpowiedni sens od stałej inwentaryzacji sensie, leksykalne substytucja nie nakłada żadnych ograniczeń na której substytutem wyboru jak najlepszego przedstawiciela tego słowa w kontekście. Przez nie zalecania inwentaryzacji, leksykalne podstawienie rozwiązuje kwestię ziarnistości wyróżnień zmysłowych i zapewnia równe warunki dla automatycznych systemów, które automatycznie uzyskują sens wyrazu (a zadanie dalej Worda Sense Induction ).

Ocena

W celu oceny systemów automatycznych na leksykalnym substytucji, zadanie zostało zorganizowane w Semeval-2007 konkursu oceniającego, która odbyła się w Pradze w 2007. Semeval-2010 zadania na cross-językowej substytucji leksykalnym również miała miejsce.

Skip-gram modelu

Model pominięcia gramów wykonuje rozmowę z podobnym znaczeniu pod przestrzeni wektorowej (zbiór obiektów, które mogą być dodawane razem, pomnożonej przez numery), które znajdują się blisko siebie w N wymiarach (wykaz elementów). Różnorodność sieci neuronowe (komputerowym wzorowane ludzkiego mózgu) są uformowane razem jako wyniku wektory i sieci, które są związane ze sobą. To wszystko odbywa się w wymiarach słownictwa, które zostały wygenerowane w sieci. Model ten jest stosowany w algorytmach automatyki substytucja i predykcji słownikowych. Jeden taki algorytm opracowany przez Oren Melamuda Omer Levy i Ido Dagan wykorzystuje model Skip-gramową znaleźć wektor dla każdego słowa i jego synonimy. Następnie oblicza odległość między wektorami cosinus aby określić, które słowa będą najlepsze zamienniki.

Przykład

W zdaniu jak „Pies wszedł w szybkim tempie” każde słowo ma konkretnego wektora w stosunku do drugiego. Wektor dla „The” byłoby [1,0,0,0,0,0,0], ponieważ 1 jest słownictwo słowo i 0s są słowa otaczające że słownictwo, które tworzą wektor.

Zobacz też

Bibliografia

Referencje