Дисбаланс классов

Оценка дисбаланса классов и построение графика

class_frequency  =  df['target_col'].value_counts(normalize = True)
print(class_frequency)
class_frequency.plot(kind = 'bar')
plt.xlabel('Класс')
plt.ylabel('Доля')
plt.title(' Доля классов целевого признака')

 

1. Взвешивание классов

model = LogisticRegression(random_state=12345, solver='liblinear', class_weight='balanced')

2. downsample

3. upsample