подсчет количества упоминаний

Лемматизация

Опубликовано пт, 11/20/2020 - 00:13 пользователем Ksenia

1) pymystem3 (библиотека, разработанная сотрудниками Яндекса)

from pymystem3 import Mystem

name = Mystem()
test_name = list(df['text_col'])

а) some_words_or_text = '...' created_lemmas = name.lemmatize(some_words_or_tex) print(created_lemmas)

б)created_lemmas = ' '.join(name.lemmatize(some_words_or_text)) print(created_lemmas) склеивает

в) from collections import Counter print(Counter(created_lemmas)) сколько раз употребляется каждое слово

г)функция принимает текст и возвращает лемматизированную строку:

Подробнее о Лемматизация
Войдите или зарегистрируйтесь, чтобы отправлять комментарии