Подготовка
1. Создать две категории (например для двоичной бинарной классификации для машинного обучения)
df.loc[df['col1'] <= 10, 'col2'] = 0.0
df.loc[df['col1'] > 10, 'col2'] = 1.0
2. Сохранить в переменной признаки
а) сохранить нужные столбцы
features = df.iloc[:, 1:8]
б)вырезать лишние столбцы
features = df.drop(['col1', 'col5'], axis=1)
3. Сохранить в переменной целевой столбец
target = df['col_name']
features = df.drop(['col5', 'target_col'], axis=1)
target = df['target_col']
4. Импортировать решающее дерево из библиотеки sklearn
from sklearn.tree import DecisionTreeClassifier
5. Создать пустую модель и сохраните её в переменной
model = DecisionTreeClassifier()
6. Методы
- метод fit() для запуска модели
model.fit(features, target)
- чтобы предсказать ответы метод predict()
answers = model.predict(new_features)