Опубликовано пн, 02/08/2021 - 12:51 пользователем Ksenia
I Прямое кодирование (One-Hot Encoding, OHE) для преобразования категориальных признаков в численные.
Работает со всеми моделями, в том числе подходит и для логистической регрессии, когда все признаки должны стать количественными.
1) создаём новый столбец для каждого варианта значения признака, в котором будет уже новый признак дамми-признак, дамми-переменная;
2) присваиваем 1, если экзмепляру категория подходит, присваиваем 0 - если не подходит.
функция pd.get_dummies()
а) ко всему датафрейму