категории

Разделение на категории, диапазоны, градации

category = pd.cut(df['category'], [0, 10, 20])
чтобы добавить в столбец
df['col_category'] = pd.cut(df['col1'], [0, 10, 20])

Внесение результата работы функции в таблицу с помощью метода .apply ()

1) создаем функцию для разделения на категории
(она возвращает название категории в зависимости от соответствия условию)
(*отступы могут отображаться некорректно)

def my_function_name(smth_to_enter_in_function):

Словари, таксономия и категории. Категоризация

df_new = df[['col1',col2','col3']]
(перенос столбцов в новую таблицу)

df = df.drop_duplicates().reset_index(drop=True)
(удаление дубликатов)

df.groupby('col1').mean().sort_values('col2',ascending=False)
(группировка по столбцу col1, среднее и сортировка по col2 по убыванию)

Пример внесение результата работы кастомной функции в таблицу с помощью метода .apply () https://data-scientists.ru/node/46

Подписка на RSS - категории