Порядок работы с текстами для классифкации

Опубликовано ср, 05/05/2021 - 15:36 пользователем Ksenia

Предобработка: токенизация (на слова и добавление маркеров начала и конца предложения), лемматизация к начальной форме, удаление стоп-слов.
Перевод токенов в векторы заданной длины (с помощью словаря токенов
Передают векторы (признаки) модели, прогнозируют эмоциональную окраску текста — 0 («отрицательная») или 1 («положительная»).

Главное меню