Zestaw narzędzi do języka naturalnego — Natural Language Toolkit
Pierwotny autor (autorzy) | Steven Bird, Edward Loper, Ewan Klein |
---|---|
Deweloper(zy) | Zespół NLTK |
Pierwsze wydanie | 2001 |
Wersja stabilna | 3.6.1 / 7 kwietnia 2021 r
|
Magazyn | |
Napisane w | Pyton |
Rodzaj | Przetwarzanie języka naturalnego |
Licencja | Apache 2.0 |
Stronie internetowej | www |
Natural Language Toolkit , lub bardziej powszechnie NLTK , to zestaw bibliotek i programów dla symbolicznej i statystycznej przetwarzania języka naturalnego (NLP) dla języka angielskiego, napisany w języku programowania Python . Został opracowany przez Stevena Birda i Edwarda Lopera na Wydziale Informatyki i Nauk Informacyjnych Uniwersytetu Pensylwanii . NLTK zawiera demonstracje graficzne i przykładowe dane. Towarzyszy mu książka wyjaśniająca podstawowe koncepcje zadań przetwarzania języka obsługiwanych przez zestaw narzędzi, a także książka kucharska.
NLTK ma na celu wspieranie badań i nauczania w NLP lub ściśle powiązanych obszarach, w tym lingwistyki empirycznej , kognitywistyki , sztucznej inteligencji , wyszukiwania informacji i uczenia maszynowego . NLTK jest z powodzeniem wykorzystywany jako narzędzie dydaktyczne, jako indywidualne narzędzie do nauki oraz jako platforma do prototypowania i budowania systemów badawczych. 32 uniwersytety w USA i 25 krajach korzystają z NLTK na swoich kursach. NLTK obsługuje klasyfikację, tokenizację, stemming, tagowanie, parsowanie i funkcje wnioskowania semantycznego.
Najważniejsze informacje z biblioteki
- Analiza leksykalna : tokenizator słów i tekstu
- n-gram i kolokacje
- Tager części mowy
- Model drzewa i Chunker tekstu do przechwytywania
- Rozpoznawanie nazwanych podmiotów