прямое кодирование

Прямое кодирование, порядковое кодирование

I Прямое кодирование (One-Hot EncodingOHE) для преобразования категориальных признаков в численные.

Работает со всеми моделями, в том числе подходит и для логистической регрессии, когда все признаки должны стать количественными.

1) создаём новый столбец для каждого варианта значения признака, в котором будет уже новый признак дамми-признак, дамми-переменная;

2) присваиваем 1, если экзмепляру категория подходит, присваиваем 0 - если не подходит.

 функция pd.get_dummies()

а) ко всему датафрейму

Подписка на RSS - прямое кодирование