Опубликовано вт, 02/16/2021 - 10:51 пользователем Ksenia
I. Взвешивание классов.
В случае, если имеет место разное количество экземпляров классов, можно использовать взвешивание классов с помощью аргумента class_weight библиотеки sklearn.
Аргумент class_weight есть у решающего дерева, случайного леса, логистической регрессии.
class_weight='balanced'
model = LogisticRegression(random_state=5678, solver='liblinear', class_weight='balanced')
II. Увеличение выборки (upsampling) с помощью синтаксиса умножения списков:
name_x_n = name * n