взвешивание классов

Несбалансированная классификация

I. Взвешивание классов.

В случае, если имеет место разное количество экземпляров классов, можно использовать взвешивание классов с помощью аргумента class_weight библиотеки sklearn.

Аргумент class_weight есть у решающего дерева, случайного леса, логистической регрессии.

class_weight='balanced'

model = LogisticRegression(random_state=5678, solver='liblinear', class_weight='balanced')

II. Увеличение выборки (upsampling) с помощью синтаксиса умножения списков:
name_x_n = name * n

Подписка на RSS - взвешивание классов