сводные таблицы

Работа с несколькими показателями и подсчет долей, сводные таблицы

df.groupby('col1')[['col2']].mean()

Способ 1

df.groupby(['col1', 'col2'])['col3'].aggregate('mean').unstack()
или
df.groupby(['col_left', 'col_high'])['col_value'].aggregate('mean').unstack()

Способ 2
df.pivot_table('col3', index='col1', columns='col2')
df.pivot_table('col_value', index='col_left', columns='col_high')

Разделение на категории, диапазоны, градации
category = pd.cut(df['category'], [0, 10, 20])
чтобы добавить в столбец
df['col_category'] = pd.cut(df['col1'], [0, 10, 20])

Сводные таблицы, .pivot_table() или .groupby() и .agg()

1. С помощью .pivot_table()

Аргументы метода:
• index — столбцы, по которым группируют данные (идет в левый столбец)
• columns — столбец, по значениям которого происходит группировка (идет в строку-шапку)
• values — значения, которые будут использованы (будут в ячейках)
• aggfunc — функция, применяемая к значениям (например суммирование)

pivot_table_name = old_table_name.pivot_table(index=['col', 'col3'], columns='old_source_to_make_head_line', values='col4', aggfunc='sum')

Подписка на RSS - сводные таблицы