Опубликовано пт, 11/20/2020 - 00:13 пользователем Ksenia
1) pymystem3 (библиотека, разработанная сотрудниками Яндекса)
from pymystem3 import Mystem
name = Mystem()
test_name = list(df['text_col'])
а) some_words_or_text = '...' created_lemmas = name.lemmatize(some_words_or_tex) print(created_lemmas)
б)created_lemmas = ' '.join(name.lemmatize(some_words_or_text)) print(created_lemmas) склеивает
в) from collections import Counter print(Counter(created_lemmas)) сколько раз употребляется каждое слово
г)функция принимает текст и возвращает лемматизированную строку: